AiST.Ai
aist.it / SDK · agents · multi-tenant · embed

AI-агенты в ваш продукт за неделю. SDK, виджеты, multi-tenant.

Прототипирование AI-фичи — за день, релиз в продуктив — за неделю. Готовый SDK, UI-компоненты и backend-платформа для встраивания AI-ассистентов и агентов в продукт компании: чат-виджеты в ЛК, RAG по документации, AI-копилот в дашборде, AI-онбординг новых пользователей, streaming и tool-calling из коробки. Multi-tenant и per-tenant биллинг токенов, BYO LLM (OpenAI, GigaChat, self-hosted) — подменяете модель за 5 минут. Product-команда, Tech Lead, Frontend собирают и катят сами — без ML-инфраструктуры и месячных спринтов. SDK для JS, React, iOS и Android — в npm и CocoaPods.

  • SDK для JS / React / iOS / Android
  • Streaming & tool-calling
  • Multi-tenant & per-tenant billing
  • BYO LLM · OpenAI · GigaChat · self-host
// что болит у продуктовой команды

AI в продукте — это полгода инфраструктуры до первой кнопки.

Продакт хочет «AI-чат в ЛК и умный поиск по каталогу». Бэкенд пишет очереди, токенизатор, retry, кэш и стриминг. Фронт ждёт SDK и виджет. ИБ ругает прокси на OpenAI. ML просит год на эмбеддинги. Релиз — через два квартала. Конкурент уже выкатил.

// time-to-market

Полгода до первой AI-фичи

Каждая команда строит свою AI-инфраструктуру: RAG, gateway, retry, cost-control, observability, multi-tenant. До продуктовой ценности руки доходят, когда конкуренты уже шипанули.

Готовая платформа + SDK + UI-компоненты. Первый агент в продукте — за день, в продуктиве — за неделю.
// integration

Каждая интеграция — спринт

Новый клиент хочет свой контекст и своего поставщика модели. Прокинуть данные тенанта в промпт, изолировать историю, посчитать стоимость на него — ещё месяц команды.

Multi-tenant из коробки. Изоляция данных, per-tenant модели, лимиты, биллинг — штатно. Подключить нового клиента — часы, не недели.
// ops & cost

AI в проде = чёрный ящик

Не понятно, какой агент сколько стоит, кто его вызывает, какая модель лучше работает, где галлюцинирует. CFO просит план по токенам — а его нет.

Observability диалогов, evals, cost-per-feature, A/B моделей, lмиты на tenant. Видно, сколько стоит каждая фича.
// что важно ИТ-компании

Не «внедрили AI». А цифры в скорости релизов и юнит-экономике.

Каждая AI-фича — с понятным TTM, стоимостью на DAU, метрикой adoption и вкладом в удержание и апсейл. Не «у нас есть AI» — а конкретный P&L продукта.

// time-to-market ×6

Скорость релизов AI-фич

Шаблоны агентов, готовый SDK, UI-компоненты, gateway к моделям. Команда продукта шипает сама.

// adoption +34%

Доля пользователей AI-фич

Виджет в UX продукта, не отдельный сайт. Клиент видит ассистента там, где уже работает.

// cost −62%

Cost / DAU на AI-функции

Кэширование, роутинг модели по задаче, дешёвые модели на типовом, дорогие — на сложном.

// retention +18 п.п.

Месячное удержание AI-tenants

AI-onboarding, contextual help, co-pilot в ключевых сценариях. Клиент быстрее ловит value.

// как это работает

AI-платформа поверх вашего продукта. От БД до кнопки в UI.

Подключаем источники продукта (БД, события, документация, контент пользователей), собираем агентов из шаблонов, встраиваем в UI через готовый SDK и UI-компоненты. Управляет всем продуктовая команда.

// L0 · ваш контур (cloud / on-prem / hybrid)
cluster AiST IT · ваш стек k8s · multi-tenant · BYO LLM
// L1 · источники продукта
db БД продукта Postgres · ClickHouse
events Очереди и события Kafka · Redis
docs Документация и help RAG · embeddings
auth Auth и tenants OIDC · JWT
// L2 · AI-агенты в вашем продукте
agent Chat-виджет UI · streaming
agent RAG над контентом поиск · ответы
agent AI co-pilot дашборд · saas
agent Backend classifier tool · pipeline
// L3 · кто управляет
пользователь Product Owner сценарии · UX
пользователь Tech Lead модели · политики
пользователь Frontend Lead SDK · виджет · UX
пользователь DevOps / Security scale · аудит · KMS
  • 01
    Подключаем источники продукта через ваши API Postgres / ClickHouse / S3, Kafka / Redis, ваш help-центр и документация, ваша система авторизации. Агент работает в контексте tenant и юзера.
  • 02
    Берём шаблон агента и настраиваем под продукт Chat, RAG, co-pilot, classifier, agent. 30+ готовых сценариев со стримингом, tool-calling, evals и rate-limit из коробки.
  • 03
    Встраиваем в UI готовым SDK и компонентами 5 строк кода в React / Vue / Next / iOS / Android. Виджет, ghost text, side-panel, command palette — брендируется под ваш дизайн.
  • 04
    Релизим, мониторим, оптимизируем A/B моделей, observability диалогов, evals, cost-per-feature, лимиты на tenant, fallback на дешёвую модель. Rollback агента — одним кликом.
// наши инструменты

Что ускоряет запуск AI в продукте в 5–10 раз.

Мы не продаём «модель». Мы даём конструктор агентов, SDK для встраивания, multi-tenant платформу и observability — чтобы продуктовая команда выкатывала AI-фичи как обычные фичи, а не как R&D-проект.

No-code конструктор агентов

Промпт, инструменты, источники, evals — визуально. Версии и A/B из коробки.

no-code

Шаблоны под продукт

30+ сценариев: chat, RAG, co-pilot, agent, classifier, summarizer, voice.

templates

SDK для любого стека

JS / TS, React, Vue, Next, Nuxt, Svelte, iOS (Swift), Android (Kotlin), Flutter, server SDK на Node / Python / Go / Java.

sdk

UI-компоненты

Chat-виджет, ghost text, side-panel, command palette, action bar. Брендируется в ваш дизайн.

embed

BYO LLM через Gateway

OpenAI, Claude, Gemini, GigaChat, YandexGPT, Llama, ваш self-host. Роутинг по задаче, fallback, retry.

gateway

Streaming & tool-calling

WebSocket / SSE из коробки. Tool-calling, structured outputs, function-calling по OpenAPI.

streaming

RAG-движок

Эмбеддинги, гибридный поиск, ранжирование, цитата источника. Postgres pgvector / Qdrant / Tantor.

rag

Multi-tenant & биллинг

Изоляция данных, per-tenant модели и промпты, лимиты, метрики, биллинг по токенам и запросам.

saas-ready

Cost guardrails

Лимиты на tenant / юзера / агента, кэширование, fallback на дешёвую модель, бюджет в рублях.

finops

A/B, evals & rollback

Сравнение моделей и промптов, оценка качества, регресс-тесты, rollback агента в 1 клик.

experiments

Observability диалогов

Трассировка каждого вызова, logs / metrics / traces в OpenTelemetry, Grafana, Datadog.

otel · grafana

White-label & enterprise

Ваш бренд, ваш домен, on-prem для клиента, SSO/SAML, аудит и DLP для корп. сегмента.

enterprise
// 5 строк кода

Встроить AI-ассистента в продукт — как поставить кнопку.

SDK берёт на себя стриминг, ретраи, кэш, токены, multi-tenant и evals. Frontend пишет только UX. Backend — только бизнес-логику.

React Vue iOS Server Node
// embed AI co-pilot into your SaaS dashboard
import { AistChat, useAistAgent } from '@aist/react'

export function DashboardCoPilot({ tenantId, user }) {
  const agent = useAistAgent('sales-copilot', { tenantId })
  return <AistChat agent={agent} context= streaming />
}

Один компонент. Контекст вашего продукта. Streaming, evals и multi-tenant — под капотом.

Вам не нужно настраивать LLM, прокси, очереди или RAG-индекс. Это всё уже есть в платформе. Вы пишете промпт агента в кабинете — фронт получает работающий виджет.

  • 01
    tenantId — штатно. Изоляция истории, лимитов, биллинга на уровне SDK.
  • 02
    context — ваш. Передаёте текущего юзера, объект, сессию — агент видит, где он работает.
  • 03
    streaming по умолчанию. SSE / WebSocket, без строки кода на транспорт.
  • 04
    evals и observability. Каждый диалог трассируется, оценивается и уходит в ваш Grafana / Datadog.
// стек интеграций

Подключаемся к вашему стеку без переписывания продукта.

REST / WebSocket / GraphQL / gRPC — штатно. Ваш Auth, ваша БД, ваша observability — остаются вашими. Платформа становится сервисом, как Stripe или Auth0 — только для AI.

// frontend

ReactVueNextNuxtSvelteAngulariOS SwiftAndroid KotlinFlutter

// backend

NodePythonGoJavaKotlin.NETPHPRubyRust

// data & vector

PostgresPropgvectorClickHouseQdrantTantorWeaviateS3 / Ceph

// auth & identity

KeycloakAuth0OIDCOAuth2SAMLSSOALD Pro

// observability & CI/CD

OpenTelemetryGrafanaPrometheusSentryDatadogGitLab CIGitHub Actions

Платформа поверх вашего продукта — не вместо.

Не просим заменить базу, авторизацию, observability или CI. Подключаемся к вашему стеку по стандартам, отдаём готовый SDK для продукта и backend-API для агентов. Вы остаётесь владельцем продукта, мы даём AI-инфраструктуру.

1 деньпервый агент в UI
30+шаблонов для продукта
5 строккода для встраивания
Контекст продукта

Tenant, юзер, объект, сессия, история продукта. Передаёте через SDK — агент знает, где он работает.

Tool-calling в ваш backend

Описываете OpenAPI/JSON-схему — агент сам вызывает ваши ручки, создаёт записи, читает данные, оформляет действия.

UI везде

Web-виджет, side-panel, ghost text, голос в мобайле, бот в Telegram / VK Teams для ваших клиентов.

// готовые сценарии

30+ AI-агентов под типовые продуктовые задачи.

Шаблон + контекст вашего продукта = работающая фича в UI. Без многомесячного R&D. Каждый сценарий — с понятным TTM и вкладом в adoption.

// chat
TTM 1 день

AI-чат в ЛК продукта

Готовый виджет с брендингом и вашим контекстом. Streaming, история по юзеру, tool-calling к вашему backend.

SDKстримингtool-calls
// rag
TTM 3 дня

RAG над документацией продукта

Help-центр и API-доки становятся умным поиском с цитатой источника. −60% тикетов в саппорт.

RAGpgvectorцитата
// co-pilot
TTM 1 нед.

AI co-pilot в дашборде SaaS

«Покажи отказы по воронке за неделю», «создай кампанию по этому сегменту» — агент делает, юзер подтверждает.

BItool-callsside-panel
// onboarding
TTM 1 нед.

AI-onboarding нового tenant

Агент проводит первого юзера по продукту, помогает завести первый объект, отвечает на вопросы. CR onboarding +18%.

guideeventsRAG
// helpdesk
TTM 1 нед.

AI-helpdesk в продукте

Отвечает в продукте, эскалирует в Jira / Service Desk, заводит тикет с контекстом юзера. −60% нагрузки на L1.

JiraRAGчат
// pipeline
TTM 3 дня

Backend-classifier в pipeline

Классификация обращений, тегирование, ранжирование, модерация. Один HTTP-вызов в вашем сервисе.

APItoolstructured
// white-label
TTM 2 нед.

White-label AI для ваших клиентов

Ваши enterprise-клиенты получают ваш же продукт + AI в их контуре, под их брендом, на их железе.

SSOon-prembrand
// voice
TTM 2 нед.

Голосовой агент в мобайле

Native SDK для iOS / Android. ASR + диалог + tool-calls. Push-to-talk и hands-free режимы.

iOSAndroidASR
// CTO
TTM n/a

AI-аналитик продукта для CTO

«Сколько стоит AI-чат на DAU?», «Какая модель работает лучше на tenant X?» — ответ голосом из evals и cost-логов.

BIevalscost
// кто управляет AI-фичами

AI в продукте — продуктовая фича. Не R&D-проект.

Product Owner пишет промпт. Tech Lead настраивает политику и инструменты. Frontend ставит виджет. DevOps смотрит cost и latency. ML-команда нужна только для нестандартного дообучения.

// как было

AI = R&D-проект на квартал

  • Каждая AI-фича — своя инфраструктура: gateway, RAG, очереди, кэш, evals.
  • Multi-tenant пишут руками. Биллинг токенов считают в Excel.
  • Каждое обновление промпта — релиз бэкенда.
  • Observability диалогов нет. Стоимость на DAU неизвестна.
  • Не работает — виноват «не тот контекст».
Итог: AI-фича шипнут через два квартала, конкурент уже там.
// как с AiST

AI = обычная фича в спринте

  • Product Owner правит промпт в кабинете — без деплоя.
  • Tech Lead меняет модель, инструменты, политику — без кода.
  • Frontend ставит виджет за 5 строк. SDK берёт стриминг и ретраи на себя.
  • Multi-tenant, лимиты и биллинг по токенам — штатно.
  • Cost-per-feature, evals, A/B моделей — из коробки.
Итог: AI-фичу шипают за неделю, продукт растёт без роста ML-команды.
// для кого в ИТ-компании

Решение, которое нравится CTO, продукту и ИБ одновременно.

ИТ-компания живёт скоростью релизов, юнит-экономикой продукта и безопасностью данных клиента. AiST спроектирован так, чтобы все три стороны сказали «да».

// для CTO и продукта

Скорость и юнит-экономика

  • TTM AI-фич ×6
  • Adoption AI-функций +25–40%
  • Cost / DAU на AI −40–70%
  • Удержание AI-tenants +10–20 п.п.
  • Команда продукта шипает сама
  • ML-команда — только на нестандарт
// для CISO и DPO

Данные и контур

  • On-prem / private cloud / hybrid
  • BYOK для шифрования
  • Изоляция данных по tenant
  • 152-ФЗ, GDPR-ready
  • Полный аудит запросов и tool-calls
  • SSO / SAML / OIDC / DLP
// для DevOps и SRE

Эксплуатация и надёжность

  • Helm-чарт, k8s, autoscaling
  • SLA на инференс, p99 latency
  • OpenTelemetry, Grafana, Sentry
  • Fallback и circuit breaker на модели
  • Версии, A/B, rollback агентов
  • GitOps-friendly деплой промптов
// часто спрашивают

Вопросы, которые задают перед интеграцией.

За сколько встроится первый агент в продукт?

Chat-виджет в ЛК — 1–2 дня. RAG над документацией — 3–5 дней. AI co-pilot с tool-calling к вашему backend — 1–2 недели. Сложность — в вашем продукте, не в AI-инфре.

Нужна ли собственная ML-команда?

Нет. Product Owner правит промпт в кабинете, Tech Lead настраивает модели и инструменты, Frontend ставит виджет за 5 строк. ML нужен только если дообучаете свою модель на своих данных — это отдельный опциональный трек.

Какие модели можно использовать?

Любые. OpenAI, Claude, Gemini, GigaChat, YandexGPT, Llama, Qwen, ваши self-host. Через Gateway — роутинг по задаче, fallback, retry, кэш. Модель меняется в настройках агента, без кода.

Как с multi-tenant и данными клиентов?

Изоляция по tenantId — штатно: история, ключи, лимиты, биллинг. Можно поднять отдельный инстанс платформы на контуре enterprise-клиента (white-label, on-prem). Данные клиента не уходят к другому tenant и не уходят вовне.

Как считать стоимость AI на продукт?

Cost-per-feature, cost-per-tenant, cost-per-DAU — из коробки. Лимиты по tenant и по агенту, кэширование, fallback на дешёвую модель, биллинг в рублях. CFO защищает бюджет по цифрам, а не по надежде.

А evals и контроль качества?

Каждый агент имеет тестовый набор и evals на CI. A/B моделей и промптов на живом трафике. Observability диалогов в OpenTelemetry. Регресс на деплое промпта. Rollback агента — одним кликом.

// next step

Покажем за 30 минут — как ваш продукт получает AI-фичу за неделю.

Заберём стек продукта, описание сценария и модель монетизации — вернёмся с готовым PoC, оценкой стоимости на DAU и планом интеграции на 1–2 спринта.

// нажимая, вы соглашаетесь с обработкой данных по 152-ФЗ