AiST.Ai
aist.rag / knowledge · search · grounded answers

Корпоративный поиск и ответы по документам компании. Без галлюцинаций.

AiST RAG превращает 1С ДО, файлошары, СБИС, Confluence и почту в единый AI-поиск: задаёте вопрос словами — получаете точный ответ со ссылками на первоисточник. Уже встроен в AiST Platform — включается чек-боксом.

  • Гибридный поиск + reranker
  • 40+ типов источников
  • ACL до уровня документа
  • Цитаты с ссылкой на абзац
  • 152-ФЗ · on-prem · ru-эмбеддинги
// проблема

Корпоративные знания спрятаны в 30 системах. Никто не может их найти.

По данным McKinsey сотрудник тратит 1.8 часа в день на поиск нужной информации. А ChatGPT отвечает уверенно — но выдумывает половину фактов и не знает ваших договоров.

// поиск

Знания живут в 30 системах

1С:Документооборот, СБИС, Confluence, файлошары, Outlook, Teams, портал, Sharepoint. Чтобы найти ответ, сотрудник лезет в 5 систем — или просто звонит коллеге.

Один поиск по всему. Ответ — из всех источников, с цитатой и ссылкой.
// галлюцинации

ChatGPT уверенно врёт

Публичный AI не знает ваших договоров и регламентов. Сочиняет правдоподобные ответы — юрист и продакт это потом разгребают неделями. Доверять нельзя.

Grounded answers: модель отвечает только по найденным документам. Нет источника — нет ответа.
// безопасность

Нельзя загружать в ChatGPT

Договоры, прайсы, перс. данные клиентов, проектная документация — по 152-ФЗ и NDA в публичный AI это нельзя. А значит, AI для самой ценной работы — недоступен.

RAG крутится в вашем контуре. Документы не покидают периметр. ACL наследуется из 1С/AD.
// как это работает

Полный RAG-конвейер уже собран. Вы только подключаете источники.

Парсинг, OCR, чанкинг, эмбеддинги, гибридный поиск, reranker, генерация ответа с цитатами — каждая стадия настроена и работает «из коробки» внутри AiST Platform.

// L1 · загрузка
connector 1С:ДО incremental
connector СБИС авто-синк
connector файлошара SMB / NFS
connector Confluence + ACL
// L2 · обработка
parse PDF · DOCX · XLSX + OCR (AiST OCR)
chunk семантическое деление таблицы · разделы
embed ru-эмбеддинги BGE · GigaEmbed
store vector + ACL Qdrant · pgvector
// L3 · ответ
retrieve hybrid search BM25 + vector
rerank cross-encoder top-200 → top-8
generate LLM с контекстом через Gateway
cite ответ + ссылки проверка фактов
  • 01
    Подключаете источники — чек-боксом 40+ коннекторов: 1С:ДО, СБИС, файлошары (SMB/NFS/S3), Confluence, Sharepoint, Outlook, Bitrix24, веб-сайт, БД. Учётка сервисного пользователя — и готово.
  • 02
    Платформа сама всё индексирует Распознаёт сканы (AiST OCR), достаёт таблицы из Excel, разбирает PDF и PPT. Чанкинг по смыслу, не по словам. Инкрементальный синк — меняется документ, обновляется индекс.
  • 03
    Гибридный поиск + reranker BM25 ловит точные термины и номера, vector — смысл. Cross-encoder отбирает топ-8 чанков из 200 кандидатов. Точность ответа — на уровне 0.92–0.96 по корпоративным запросам.
  • 04
    Ответ с цитатами и проверкой LLM формирует ответ только по найденным фрагментам. Каждое утверждение — со сноской на абзац документа. Если в документах нет ответа — честно скажет «не знаю».
// возможности

Не «эмбеддинги в Pinecone». Полноценный enterprise-RAG.

12 инженеров два года собирали то, что у вас включается одной галочкой. Всё промышленно настроено — парсинг таблиц, ACL, инкрементальный синк, мультиязычность, обновление индекса в real-time.

Hybrid Search

BM25 + dense vector + sparse vector. Ловит и точные номера договоров, и смысловые запросы.

retrieval

Reranker

Cross-encoder отбирает лучшие фрагменты из кандидатов. +30% к точности.

cross-encoder

Multi-tenant индексы

Каждое подразделение — свой индекс. Юристы не ищут по HR, продажи — по юристам.

isolation

ACL до документа

Права наследуются из 1С:ДО, AD, Confluence. Сотрудник видит только то, что ему положено.

rbac · row-level

OCR на лету

Сканы договоров, фото с планшета, PDF без текста — через AiST OCR. Русский, англ., рукопись.

ocr

Парсинг таблиц

Excel, таблицы в PDF и DOCX — сохраняем структуру. Можно спрашивать «сколько в строке 7».

tables · structure

Цитаты и подсветка

Каждый факт в ответе — со ссылкой на абзац. Можно открыть документ и увидеть выделенное.

citations

Инкрементальный синк

Изменился документ — обновился индекс. Удалили — исчез из поиска. Без ручных переиндексаций.

real-time

RU-эмбеддинги

BGE-M3, GigaEmbed, E5, ваша модель. Заточены под русский — не английский OpenAI ada.

multilingual

Streaming ответы

Ответ печатается по мере генерации. Пользователь не ждёт 10 секунд молчания.

stream · sse

Метрики качества

Precision, recall, citation accuracy, faithfulness — из коробки. Видите, где RAG проседает.

eval · ragas

Любая LLM через Gateway

GPT-4, Claude, GigaChat, YandexGPT, ваш self-host. Меняется в настройках — без кода.

multi-model
// источники знаний

40+ коннекторов к тому, где у вас уже лежат знания.

Не нужно «сначала собрать всё в корпоративный портал». Подключаемся к тому, что есть — 1С, файлошары, СБИС, почта, Confluence, БД. Источники остаются на своих местах, RAG читает их «на живую».

// документы и файлы

1С:ДОСБИСКонтур.ДокументыSharepointConfluenceNotionМойОфис

// файлошары

SMB / CIFSNFSS3 / CephFTPWebDAVЯ.Диск 360Dropbox

// CRM & ERP

1С:ERPamoCRMBitrix24SberCRMМегаПланJira

// почта & коммуникации

Outlook / ExchangeRuPostVK TeamsMS TeamsMattermostTelegram-каналы

// БД & справочники

PostgresProClickHouseTantorGreenplumOracleMS SQL

// веб & внешнее

Сайт компанииКорп. порталWikiRSSAPI endpointsГосуслуги API

Один индекс на всю компанию — или по одному на каждый отдел.

Внутри AiST Platform каждое подразделение получает свою «песочницу» знаний с собственными источниками и правами. Юристы не видят документы продаж, HR не ищет по договорам клиентов. Один общий индекс — только для того, что должно быть общим.

40+типов источников
50 ТБ+в одном индексе
~ 1 сексреднее время ответа
Pull-режим

Платформа сама ходит и забирает изменения по расписанию. Ничего настраивать в источнике не нужно.

Webhook / Push

1С:ДО или Confluence сами уведомляют о новом документе — индекс обновляется за секунды.

ACL-проброс

Права из источника прорастают в индекс. Пользователь в поиске видит только то, что у него уже есть.

// что строят на AiST RAG

От юриста до поддержки клиентов — один движок, разные сценарии.

RAG — это не «ещё один поиск». Это новый интерфейс ко всем знаниям компании. Каждое подразделение собирает себе ассистента — на тех документах, которые именно ему нужны.

// юристы

Поиск по договорной базе

«Найди все договоры с типовыми штрафами больше 5%» или «есть ли в нашей практике контракты с такой формулировкой?». Ответ за секунды, не за часы ассистента.

1С:ДОсудебная практикаOCR
// hr

Помощник по регламентам

Сотрудник спрашивает «сколько дней отпуска у меня осталось и как оформить отгул» — получает ответ из ваших ЛНА и 1С:ЗУП. HR освобождается от типовых вопросов на 60%.

положения1С:ЗУПWiki
// поддержка

Ответы клиентам по документации

Чат на сайте/в Telegram отвечает на вопросы по продукту с точностью эксперта — на базе вашей документации, FAQ и тикетов. 70% обращений закрываются без человека.

docsJiraтикет-история
// продажи

Поиск по тендерной документации

«Найди в этом тендере на 200 страниц все требования к сертификации». Ответ за 30 секунд, не за день. Менеджер успевает участвовать в 5 тендерах вместо 1.

ЕИС закупкиPDF OCRamoCRM
// производство

Тех. документация для инженеров

«Какой момент затяжки болтов на узле X?» — ответ из ГОСТ, регламентов и чертежей. Инженер на площадке получает ответ с планшета за 5 секунд, без звонка в офис.

ГОСТчертежиСНиП
// руководитель

Поиск по корпоративной памяти

«Что мы решили на стратегии в сентябре по проекту X?» — ответ из протоколов, писем, презентаций. Корпоративная память перестаёт зависеть от конкретных людей.

почтаConfluenceпротоколы
// уже на платформе

Вам не надо собирать RAG. Он уже собран и работает.

Каждый стартап «делает свой RAG» — и через 6 месяцев получает прототип на 1000 документов. У нас всё уже промышленно: vector DB, эмбеддинги, OCR, ACL, мониторинг, eval. Включается чек-боксом.

Включается — не строится.

AiST RAG — это сервис в составе AiST Platform. Вам не нужны ML-инженеры, vector DB в инфре, разработка пайплайна и месяцы экспериментов. Открыли кабинет, выбрали источники, нажали «индексировать» — через час пилот в продуктиве.

«Мы три квартала пытались собрать свой RAG. Развернули AiST — первый рабочий ассистент юристов был у нас на четвёртый день»

Что ещё есть на AiST Platform
Vector DBQdrant / pgvector / Tantor
готово
Эмбеддинги ru/enBGE-M3 · GigaEmbed · E5
готово
OCR-конвейерчерез AiST OCR
готово
40+ коннекторов1С · СБИС · файлошары · БД
готово
Rerankercross-encoder
готово
RBAC + ACL-пробросиз 1С / AD / Confluence
готово
RAG-метрикиprecision · faithfulness · ragas
готово
Маршрутизация LLMчерез AiST Gateway
готово
// корпоративный контроль

Знания компании — под замком, под аудитом, в вашем периметре.

RAG работает с самым ценным активом компании — знаниями. Поэтому в AiST он спроектирован сначала под ИБ, и только потом под UX.

// для CISO

Закрытый периметр

  • On-prem или AiST BOX в вашем ЦОД
  • Документы не уходят за контур
  • ACL-проброс из 1С / AD / Confluence
  • RBAC до уровня документа и абзаца
  • PII-маскирование в индексе
  • Аудит каждого запроса — в SIEM
// для владельца знаний

Качество и контроль

  • Каждый ответ — с цитатой
  • Метрики precision / faithfulness
  • Чёрные списки документов и тем
  • «Не знаю» вместо галлюцинаций
  • A/B тесты эмбеддингов и промптов
  • Лог спорных ответов — на ревью
// для CFO

Прогнозируемые расходы

  • Бюджеты на токены по подразделениям
  • Кэш ответов — минус 40% к счёту
  • Эмбеддинги в своём контуре — дешевле
  • Прозрачный счёт в рублях
  • ROI: время поиска до и после
  • Подписка или выкуп лицензий
// часто спрашивают

Что обычно спрашивают перед пилотом RAG.

А точно не галлюцинирует?

Модель отвечает только по найденным фрагментам — это и есть смысл RAG. Если в документах ответа нет — ассистент честно скажет «информация не найдена». Каждое утверждение — со сноской, можно проверить в один клик.

У нас 50 ТБ файлов. Потянет?

Да. Vector DB шардируется горизонтально, эмбеддинги считаются батчами в своём контуре. Крупнейший боевой индекс — ~80 млн чанков, ответ за ~1.2 сек. Стартовый объём не ограничен — только инфра.

Как с правами доступа?

ACL прорастает из источника в индекс. Если в 1С:ДО документ виден только юристам — в поиске его тоже увидят только они. Никаких отдельных «прав на RAG» настраивать не надо.

Сколько занимает запуск?

Пилот на одну предметную область — 1–2 недели до продуктива. Полное развёртывание корпоративного RAG со всеми источниками — 4–6 недель. Шаблоны под типовые сценарии (юрист, HR, поддержка) ускоряют ещё вдвое.

Какие модели можно использовать?

Для эмбеддингов — BGE-M3, GigaEmbed, E5, ваша своя. Для ответа — любая LLM через AiST Gateway: GPT-4, Claude, GigaChat, YandexGPT, ваш self-host. Меняется в настройках бота — без кода.

Это всё-таки отдельный продукт или часть платформы?

AiST RAG — сервис в составе AiST Platform. Можно купить и использовать только его (как поиск+API), а можно сразу с конструктором ассистентов, ролями, бюджетами и Gateway. Один кабинет, один счёт.

// next step

Покажем за 30 минут — как ваши документы превращаются в точный AI-ответ.

Заберём 100 ваших документов — через неделю покажем работающего ассистента на ваших данных. Метрики качества и план рассчитаем сразу.

// нажимая, вы соглашаетесь с обработкой данных по 152-ФЗ