AiST.Ai
aist.ai-box / on-prem · 152-ФЗ

Вся Ai-экосистема в закрытом контуре от стойки до кластера.

Внутри BOX уже работают все 5 продуктов и 10 сервисов AiST — Platform, Agent, Gateway, ассистенты, RAG, аналитика, vision, voice. Распаковали → подключили → работает. Никакого интернета, ваши данные не покидают периметр.

  • 100% on-premise
  • 152-ФЗ · ФСТЭК
  • Старт за 14 дней
  • До 1024 GPU
// что внутри

Внутри BOX — вся экосистема AiST.
В закрытом периметре.

Не нужно докупать модули, интегрировать вендоров и пробрасывать API. Всё, что мы продаём как отдельные SaaS-сервисы — уже стоит на BOX и работает офлайн.

AIR-GAPPED · Ваш ЦОД
// L4 · Продукты
AiST AI Platform
AiST Agent
AiST Gateway
AiST API
White Label
// L3 · Сервисы & ассистенты
RAG Search
Code Assistant
Doc Assistant
HR Bot
Sales Bot
Analytics
Voice / ASR
Vision
Translate
Summarizer
// L2 · Ядро (LLM, Vector, Orchestrator)
LLM Engine · vLLM · TensorRT-LLM
Vector DB · Embeddings · Reranker
Kubernetes · Очереди · MLOps
RBAC · Audit · Observability
// L1 · Железо (GPU · NVMe · Network)
H100 / H200
EPYC · Xeon
NVMe 480 TB+
400 Gb/s · NVLink
внешние сервисы отключены
// масштаб

От пилота на 50 пользователей
до дата-центра под сверхзадачи.

01 · BOX Mini

Пилот

2Uстойки

Для отдела или среднего бизнеса. Запускает RAG, чат и до 3 агентов на 200 сотрудников.

  • · до 50 запросов/сек
  • · LLM до 14B
  • · 200 пользователей
02 · BOX Pro

Средний бизнес

8Uстойки

Боевой контур одной компании. Все 10 сервисов, до 20 одновременных агентов, файн-тюн на ваших данных.

  • · до 500 RPS
  • · LLM до 70B
  • · 5 000 пользователей
03 · BOX Enterprise

Корпорация

1стойка целиком

Холдинг или банк. Гео-репликация, мульти-тенант, изоляция департаментов, SLA 99.99%.

  • · до 5 000 RPS
  • · LLM до 405B
  • · 100 000 пользователей
04 · BOX DataCenter

Сверхзадачи

стоек

Свой ЦОД, свои модели, свой fine-tune фундаментальных LLM. Промышленная инференс-фабрика.

  • · до 1024 GPU
  • · обучение с нуля
  • · неограниченный rollout
// почему BOX

Что получает CIO, CISO и CFO в первом квартале.

BOX закрывает три главные тревоги enterprise одновременно — безопасность, контроль расходов и скорость внедрения. Без облака. Без vendor lock. Без компромиссов.

01 · CIO 14 дней

Прод вместо проекта

Готовый стек, преднастроенные модели, типовые сценарии. Не R&D на 18 месяцев — рабочая платформа за 2 недели.

02 · CISO 0 байт

Наружу не уходит ничего

Air-gapped контур. Нет вызовов в интернет, нет токенов в чужих логах. ФСТЭК-сертификат, КИИ, 152-ФЗ — в коробке.

03 · CFO ×7.4

ROI за квартал

Один CapEx вместо бесконечного OpEx за токены. Полная стоимость владения — на 60% ниже облачных API на горизонте 24 месяца.

// автономность

Полная независимость от внешних AI-сервисов.

BOX — это не интегратор чужих API. Это самодостаточный AI-стек, который продолжает работать даже при полном отключении интернета.

Air-gapped режим

Не делает ни одного запроса наружу. Все модели, эмбеддинги, токенайзеры — локально.

Свои LLM, свои эмбеддинги

Open-source и отечественные модели в комплекте. Меняются за час, без переписывания приложений.

Самодостаточная оркестрация

K8s, очереди, vector DB, мониторинг — внутри. Не зависит от Azure, AWS, Yandex или Google.

Обновления без интернета

Дельты приходят на физическом носителе или через выделенный канал. Соответствует требованиям КИИ.

// контур AiST BOX
Ваши данные · никогда не покидают периметр
Ваши модели · работают без интернета
Ваш аудит · каждый запрос логируется
Внешний API · отключён
Облако вендора · не используется
Сторонние логи · нет
// инфраструктура

Архитектура, под которую можно подписать SLA.

BOX поставляется как валидированная сборка — каждый компонент проверен на совместимость и нагрузку. Полная документация, схемы, runbook.

// Compute

GPU
H100 / H200 / A100
CPU
EPYC 9654 · Xeon 8480
RAM
до 4 TB / нода
Interconnect
NVLink · InfiniBand
Pps
до 5 000 RPS

// Storage & Net

NVMe
от 96 TB до 4 PB
Vector DB
до 10B векторов
Network
400 Gb/s · low-lat
Backup
S3-совместимый
HA
active-active

// Software

OS
Astra · RHEL · Ubuntu
Orchestrator
K8s 1.30 · vLLM
LLM
14B → 405B
API
OpenAI-совместимый
SLA
99.99% / 24×7
// внедрение

14 дней от подписания до первого запроса.

01
день 1–2

Архитектурная сессия

Определяем размер BOX, сценарии и модели под ваши данные.

02
день 3–7

Поставка и монтаж

Привозим железо в ваш ЦОД, монтируем, прогреваем, запускаем диагностику.

03
день 8–11

Интеграция

Подключаем к AD, CRM, документообороту. Настраиваем RBAC и аудит.

04
день 12–14

Sign-off

Нагрузочный тест, пилотные пользователи, передача в прод. SLA активен.

// сверхзадачи

Что считают на BOX наши клиенты.

Банкинг·BOX Enterprise

Скоринг 4М кредитных дел в реальном времени

RAG + Agent на 16 GPU. Решение по заявке — 1.8 секунды вместо 14 минут.

  • ×60скорость
  • −42%FTE
Промышленность·BOX Pro

Предиктивный ремонт по 14 000 датчикам

Analytic + Vision на 8 GPU. Отказы прогнозируются за 72 часа до события.

  • −27%простои
  • +₽340Мгод
Нефтегаз·BOX DataCenter

Анализ сейсмики на 1024 GPU

Свой fine-tune фундаментальной модели на петабайт данных разведки.

  • ×38скорость
  • +12залежей
// часто спрашивают

Что важно знать до закупки.

Шесть ответов на вопросы, которые задают каждый CIO, CISO и закупщик в первой встрече.

Чем BOX отличается от облачных AI-API?

Физический контур у вас в ЦОДе. Данные не покидают периметр, нет vendor lock, фиксированный CapEx вместо растущего OpEx за токены. На горизонте 24 месяцев BOX дешевле облака на 50–70%.

Что если нам нужно 10 GPU, а потом 200?

Все размеры BOX совместимы. Стартуете с Mini или Pro, добавляете ноды по мере роста. Лицензии и сценарии переносятся, переустановка не требуется.

Можно ли работать в air-gapped режиме?

Да, это штатный режим. Обновления приходят через защищённый канал или физический носитель. Соответствует требованиям КИИ и ФСТЭК.

Какие модели поддерживаются?

Open-source (Llama, Qwen, Mistral, DeepSeek), отечественные (GigaChat, YandexGPT через адаптер), любые ваши fine-tuned. Менять модель — час работы, без правок приложений.

Что входит в SLA?

24×7 поддержка, выделенный архитектор, реакция от 15 минут, целевая доступность 99.99% (для Enterprise/DataCenter), ежемесячные обновления моделей и сервисов.

Можно ли купить только железо без сервисов?

Нет, BOX поставляется как готовая платформа: железо + софт + модели + поддержка. Иначе пропадает главное преимущество — старт за 14 дней.

// next step

Подберём BOX под ваши задачи и посчитаем TCO.

Архитектор разберёт сценарии, ответит на вопросы безопасности и пришлёт сравнение TCO с облаком на 24 месяца.

// нажимая, вы соглашаетесь с обработкой данных по 152-ФЗ