aist.it / SDK · agents · multi-tenant · embed

AI-агенты в ваш продукт за неделю. SDK, виджеты, multi-tenant.

Прототипирование AI-фичи — за день, релиз в продуктив — за неделю. Готовый SDK, UI-компоненты и backend-платформа для встраивания AI-ассистентов и агентов в продукт компании: чат-виджеты в ЛК, RAG по документации, AI-копилот в дашборде, AI-онбординг новых пользователей, streaming и tool-calling из коробки. Multi-tenant и per-tenant биллинг токенов, BYO LLM (OpenAI, GigaChat, self-hosted) — подменяете модель за 5 минут. Product-команда, Tech Lead, Frontend собирают и катят сами — без ML-инфраструктуры и месячных спринтов. SDK для JS, React, iOS и Android — в npm и CocoaPods.

Запустить пилот→ Как это работает

⌬ SDK для JS / React / iOS / Android
≡ Streaming & tool-calling
▥ Multi-tenant & per-tenant billing
⛯ BYO LLM · OpenAI · GigaChat · self-host

SaaS «AcmeApp» · AI-фичи в продукте prod · v2024.5.18

time-to-ship4.2 дн.было 14 нед.

агентов в prod11+5 за квартал

tenants284multi-tenant

CHT Chat-виджет в ЛК · 12 480 диал. 93%

RAG RAG над документацией · 4 200 запр. 88%

CPL AI co-pilot в дашборде · A/B запущен 72%

CST Tenant «BigCorp» · превышен бюджет токенов 34%

ONB AI-onboarding · CR +18% 96%

p99 latency: 340 ms cost / DAU: −62% YoY

// что болит у продуктовой команды

AI в продукте — это полгода инфраструктуры до первой кнопки.

Продакт хочет «AI-чат в ЛК и умный поиск по каталогу». Бэкенд пишет очереди, токенизатор, retry, кэш и стриминг. Фронт ждёт SDK и виджет. ИБ ругает прокси на OpenAI. ML просит год на эмбеддинги. Релиз — через два квартала. Конкурент уже выкатил.

// time-to-market

Полгода до первой AI-фичи

Каждая команда строит свою AI-инфраструктуру: RAG, gateway, retry, cost-control, observability, multi-tenant. До продуктовой ценности руки доходят, когда конкуренты уже шипанули.

→

Готовая платформа + SDK + UI-компоненты. Первый агент в продукте — за день, в продуктиве — за неделю.

// integration

Каждая интеграция — спринт

Новый клиент хочет свой контекст и своего поставщика модели. Прокинуть данные тенанта в промпт, изолировать историю, посчитать стоимость на него — ещё месяц команды.

→

Multi-tenant из коробки. Изоляция данных, per-tenant модели, лимиты, биллинг — штатно. Подключить нового клиента — часы, не недели.

// ops & cost

AI в проде = чёрный ящик

Не понятно, какой агент сколько стоит, кто его вызывает, какая модель лучше работает, где галлюцинирует. CFO просит план по токенам — а его нет.

→

Observability диалогов, evals, cost-per-feature, A/B моделей, lмиты на tenant. Видно, сколько стоит каждая фича.

// что важно ИТ-компании

Не «внедрили AI». А цифры в скорости релизов и юнит-экономике.

Каждая AI-фича — с понятным TTM, стоимостью на DAU, метрикой adoption и вкладом в удержание и апсейл. Не «у нас есть AI» — а конкретный P&L продукта.

// time-to-market ×6

Скорость релизов AI-фич

Шаблоны агентов, готовый SDK, UI-компоненты, gateway к моделям. Команда продукта шипает сама.

// adoption +34%

Доля пользователей AI-фич

Виджет в UX продукта, не отдельный сайт. Клиент видит ассистента там, где уже работает.

// cost −62%

Cost / DAU на AI-функции

Кэширование, роутинг модели по задаче, дешёвые модели на типовом, дорогие — на сложном.

// retention +18 п.п.

Месячное удержание AI-tenants

AI-onboarding, contextual help, co-pilot в ключевых сценариях. Клиент быстрее ловит value.

// как это работает

AI-платформа поверх вашего продукта. От БД до кнопки в UI.

Подключаем источники продукта (БД, события, документация, контент пользователей), собираем агентов из шаблонов, встраиваем в UI через готовый SDK и UI-компоненты. Управляет всем продуктовая команда.

// L0 · ваш контур (cloud / on-prem / hybrid)

cluster AiST IT · ваш стек k8s · multi-tenant · BYO LLM

// L1 · источники продукта

db БД продукта Postgres · ClickHouse

events Очереди и события Kafka · Redis

docs Документация и help RAG · embeddings

auth Auth и tenants OIDC · JWT

// L2 · AI-агенты в вашем продукте

agent Chat-виджет UI · streaming

agent RAG над контентом поиск · ответы

agent AI co-pilot дашборд · saas

agent Backend classifier tool · pipeline

// L3 · кто управляет

пользователь Product Owner сценарии · UX

пользователь Tech Lead модели · политики

пользователь Frontend Lead SDK · виджет · UX

пользователь DevOps / Security scale · аудит · KMS

01
Подключаем источники продукта через ваши API Postgres / ClickHouse / S3, Kafka / Redis, ваш help-центр и документация, ваша система авторизации. Агент работает в контексте tenant и юзера.
02
Берём шаблон агента и настраиваем под продукт Chat, RAG, co-pilot, classifier, agent. 30+ готовых сценариев со стримингом, tool-calling, evals и rate-limit из коробки.
03
Встраиваем в UI готовым SDK и компонентами 5 строк кода в React / Vue / Next / iOS / Android. Виджет, ghost text, side-panel, command palette — брендируется под ваш дизайн.
04
Релизим, мониторим, оптимизируем A/B моделей, observability диалогов, evals, cost-per-feature, лимиты на tenant, fallback на дешёвую модель. Rollback агента — одним кликом.

// наши инструменты

Что ускоряет запуск AI в продукте в 5–10 раз.

Мы не продаём «модель». Мы даём конструктор агентов, SDK для встраивания, multi-tenant платформу и observability — чтобы продуктовая команда выкатывала AI-фичи как обычные фичи, а не как R&D-проект.

⌬

No-code конструктор агентов

Промпт, инструменты, источники, evals — визуально. Версии и A/B из коробки.

no-code

▦

Шаблоны под продукт

30+ сценариев: chat, RAG, co-pilot, agent, classifier, summarizer, voice.

templates

≡

SDK для любого стека

JS / TS, React, Vue, Next, Nuxt, Svelte, iOS (Swift), Android (Kotlin), Flutter, server SDK на Node / Python / Go / Java.

sdk

▥

UI-компоненты

Chat-виджет, ghost text, side-panel, command palette, action bar. Брендируется в ваш дизайн.

embed

⛯

BYO LLM через Gateway

OpenAI, Claude, Gemini, GigaChat, YandexGPT, Llama, ваш self-host. Роутинг по задаче, fallback, retry.

gateway

◐

Streaming & tool-calling

WebSocket / SSE из коробки. Tool-calling, structured outputs, function-calling по OpenAPI.

streaming

⛁

RAG-движок

Эмбеддинги, гибридный поиск, ранжирование, цитата источника. Postgres pgvector / Qdrant / Tantor.

rag

▤

Multi-tenant & биллинг

Изоляция данных, per-tenant модели и промпты, лимиты, метрики, биллинг по токенам и запросам.

saas-ready

⌗

Cost guardrails

Лимиты на tenant / юзера / агента, кэширование, fallback на дешёвую модель, бюджет в рублях.

finops

⎔

A/B, evals & rollback

Сравнение моделей и промптов, оценка качества, регресс-тесты, rollback агента в 1 клик.

experiments

▤

Observability диалогов

Трассировка каждого вызова, logs / metrics / traces в OpenTelemetry, Grafana, Datadog.

otel · grafana

⛨

White-label & enterprise

Ваш бренд, ваш домен, on-prem для клиента, SSO/SAML, аудит и DLP для корп. сегмента.

enterprise

// 5 строк кода

Встроить AI-ассистента в продукт — как поставить кнопку.

SDK берёт на себя стриминг, ретраи, кэш, токены, multi-tenant и evals. Frontend пишет только UX. Backend — только бизнес-логику.

React Vue iOS Server Node

// embed AI co-pilot into your SaaS dashboard
import { AistChat, useAistAgent } from '@aist/react'

export function DashboardCoPilot({ tenantId, user }) {
  const agent = useAistAgent('sales-copilot', { tenantId })
  return <AistChat agent={agent} context= streaming />
}

Один компонент. Контекст вашего продукта. Streaming, evals и multi-tenant — под капотом.

Вам не нужно настраивать LLM, прокси, очереди или RAG-индекс. Это всё уже есть в платформе. Вы пишете промпт агента в кабинете — фронт получает работающий виджет.

01
tenantId — штатно. Изоляция истории, лимитов, биллинга на уровне SDK.
02
context — ваш. Передаёте текущего юзера, объект, сессию — агент видит, где он работает.
03
streaming по умолчанию. SSE / WebSocket, без строки кода на транспорт.
04
evals и observability. Каждый диалог трассируется, оценивается и уходит в ваш Grafana / Datadog.

// стек интеграций

Подключаемся к вашему стеку без переписывания продукта.

REST / WebSocket / GraphQL / gRPC — штатно. Ваш Auth, ваша БД, ваша observability — остаются вашими. Платформа становится сервисом, как Stripe или Auth0 — только для AI.

// frontend

ReactVueNextNuxtSvelteAngulariOS SwiftAndroid KotlinFlutter

// backend

NodePythonGoJavaKotlin.NETPHPRubyRust

// data & vector

PostgresPropgvectorClickHouseQdrantTantorWeaviateS3 / Ceph

// auth & identity

KeycloakAuth0OIDCOAuth2SAMLSSOALD Pro

// observability & CI/CD

OpenTelemetryGrafanaPrometheusSentryDatadogGitLab CIGitHub Actions

Платформа поверх вашего продукта — не вместо.

Не просим заменить базу, авторизацию, observability или CI. Подключаемся к вашему стеку по стандартам, отдаём готовый SDK для продукта и backend-API для агентов. Вы остаётесь владельцем продукта, мы даём AI-инфраструктуру.

1 деньпервый агент в UI

30+шаблонов для продукта

5 строккода для встраивания

⇣

Контекст продукта

Tenant, юзер, объект, сессия, история продукта. Передаёте через SDK — агент знает, где он работает.

⇄

Tool-calling в ваш backend

Описываете OpenAPI/JSON-схему — агент сам вызывает ваши ручки, создаёт записи, читает данные, оформляет действия.

⇡

UI везде

Web-виджет, side-panel, ghost text, голос в мобайле, бот в Telegram / VK Teams для ваших клиентов.

// готовые сценарии

30+ AI-агентов под типовые продуктовые задачи.

Шаблон + контекст вашего продукта = работающая фича в UI. Без многомесячного R&D. Каждый сценарий — с понятным TTM и вкладом в adoption.

// chat

TTM 1 день

AI-чат в ЛК продукта

Готовый виджет с брендингом и вашим контекстом. Streaming, история по юзеру, tool-calling к вашему backend.

SDKстримингtool-calls

// rag

TTM 3 дня

RAG над документацией продукта

Help-центр и API-доки становятся умным поиском с цитатой источника. −60% тикетов в саппорт.

RAGpgvectorцитата

// co-pilot

TTM 1 нед.

AI co-pilot в дашборде SaaS

«Покажи отказы по воронке за неделю», «создай кампанию по этому сегменту» — агент делает, юзер подтверждает.

BItool-callsside-panel

// onboarding

TTM 1 нед.

AI-onboarding нового tenant

Агент проводит первого юзера по продукту, помогает завести первый объект, отвечает на вопросы. CR onboarding +18%.

guideeventsRAG

// helpdesk

TTM 1 нед.

AI-helpdesk в продукте

Отвечает в продукте, эскалирует в Jira / Service Desk, заводит тикет с контекстом юзера. −60% нагрузки на L1.

JiraRAGчат

// pipeline

TTM 3 дня

Backend-classifier в pipeline

Классификация обращений, тегирование, ранжирование, модерация. Один HTTP-вызов в вашем сервисе.

APItoolstructured

// white-label

TTM 2 нед.

White-label AI для ваших клиентов

Ваши enterprise-клиенты получают ваш же продукт + AI в их контуре, под их брендом, на их железе.

SSOon-prembrand

// voice

TTM 2 нед.

Голосовой агент в мобайле

Native SDK для iOS / Android. ASR + диалог + tool-calls. Push-to-talk и hands-free режимы.

iOSAndroidASR

// CTO

TTM n/a

AI-аналитик продукта для CTO

«Сколько стоит AI-чат на DAU?», «Какая модель работает лучше на tenant X?» — ответ голосом из evals и cost-логов.

BIevalscost

// кто управляет AI-фичами

AI в продукте — продуктовая фича. Не R&D-проект.

Product Owner пишет промпт. Tech Lead настраивает политику и инструменты. Frontend ставит виджет. DevOps смотрит cost и latency. ML-команда нужна только для нестандартного дообучения.

// как было

AI = R&D-проект на квартал

✕Каждая AI-фича — своя инфраструктура: gateway, RAG, очереди, кэш, evals.
✕Multi-tenant пишут руками. Биллинг токенов считают в Excel.
✕Каждое обновление промпта — релиз бэкенда.
✕Observability диалогов нет. Стоимость на DAU неизвестна.
✕Не работает — виноват «не тот контекст».

Итог: AI-фича шипнут через два квартала, конкурент уже там.

// как с AiST

AI = обычная фича в спринте

✓Product Owner правит промпт в кабинете — без деплоя.
✓Tech Lead меняет модель, инструменты, политику — без кода.
✓Frontend ставит виджет за 5 строк. SDK берёт стриминг и ретраи на себя.
✓Multi-tenant, лимиты и биллинг по токенам — штатно.
✓Cost-per-feature, evals, A/B моделей — из коробки.

Итог: AI-фичу шипают за неделю, продукт растёт без роста ML-команды.

// для кого в ИТ-компании

Решение, которое нравится CTO, продукту и ИБ одновременно.

ИТ-компания живёт скоростью релизов, юнит-экономикой продукта и безопасностью данных клиента. AiST спроектирован так, чтобы все три стороны сказали «да».

// для CTO и продукта

Скорость и юнит-экономика

TTM AI-фич ×6
Adoption AI-функций +25–40%
Cost / DAU на AI −40–70%
Удержание AI-tenants +10–20 п.п.
Команда продукта шипает сама
ML-команда — только на нестандарт

// для CISO и DPO

Данные и контур

On-prem / private cloud / hybrid
BYOK для шифрования
Изоляция данных по tenant
152-ФЗ, GDPR-ready
Полный аудит запросов и tool-calls
SSO / SAML / OIDC / DLP

// для DevOps и SRE

Эксплуатация и надёжность

Helm-чарт, k8s, autoscaling
SLA на инференс, p99 latency
OpenTelemetry, Grafana, Sentry
Fallback и circuit breaker на модели
Версии, A/B, rollback агентов
GitOps-friendly деплой промптов

// часто спрашивают

Вопросы, которые задают перед интеграцией.

За сколько встроится первый агент в продукт?

Chat-виджет в ЛК — 1–2 дня. RAG над документацией — 3–5 дней. AI co-pilot с tool-calling к вашему backend — 1–2 недели. Сложность — в вашем продукте, не в AI-инфре.

Нужна ли собственная ML-команда?

Нет. Product Owner правит промпт в кабинете, Tech Lead настраивает модели и инструменты, Frontend ставит виджет за 5 строк. ML нужен только если дообучаете свою модель на своих данных — это отдельный опциональный трек.

Какие модели можно использовать?

Любые. OpenAI, Claude, Gemini, GigaChat, YandexGPT, Llama, Qwen, ваши self-host. Через Gateway — роутинг по задаче, fallback, retry, кэш. Модель меняется в настройках агента, без кода.

Как с multi-tenant и данными клиентов?

Изоляция по tenantId — штатно: история, ключи, лимиты, биллинг. Можно поднять отдельный инстанс платформы на контуре enterprise-клиента (white-label, on-prem). Данные клиента не уходят к другому tenant и не уходят вовне.

Как считать стоимость AI на продукт?

Cost-per-feature, cost-per-tenant, cost-per-DAU — из коробки. Лимиты по tenant и по агенту, кэширование, fallback на дешёвую модель, биллинг в рублях. CFO защищает бюджет по цифрам, а не по надежде.

А evals и контроль качества?

Каждый агент имеет тестовый набор и evals на CI. A/B моделей и промптов на живом трафике. Observability диалогов в OpenTelemetry. Регресс на деплое промпта. Rollback агента — одним кликом.

// next step

Покажем за 30 минут — как ваш продукт получает AI-фичу за неделю.

Заберём стек продукта, описание сценария и модель монетизации — вернёмся с готовым PoC, оценкой стоимости на DAU и планом интеграции на 1–2 спринта.

// нажимая, вы соглашаетесь с обработкой данных по 152-ФЗ