Корпоративный AI Gateway

Высокопроизводительная платформа для inference, chat и streaming API

99.97%
Uptime
<100ms
Latency
12+
Моделей
RU
Регион
Документация API

Inference API

Масштабируемый inference на GPU-кластерах с низкой задержкой.

Chat Completions

OpenAI-совместимый chat API с контекстом до 128K токенов.

Streaming

Потоковая генерация ответов в реальном времени.

Безопасность

TLS 1.3 и аутентификация через developer portal.

Документация API

Руководство по интеграции с Signalixis AI Gateway

Обзор

Signalixis AI Gateway предоставляет доступ к LLM-моделям через REST и WebSocket API. Сервис развёрнут в регионе RU-Central.

Контакт: admin@aigate.signalixis.ru

Модели

Qwen 2.5 72B, Gemma 2 27B, Llama 3.1 70B, Mistral Large и другие.

Health Check

Мониторинг доступен по адресу /health. Возвращает метрики GPU, активные сессии и uptime.