GigaChat как закрыто-открытая программа русскоязычных foundation models

Авторы и предъявление

ТипМетка
НаименованиеGigaChat как закрыто-открытая программа русскоязычных foundation models
АвторGigaChat team
Авторai-sage
ПлощадкаarXiv
Площадкаhuggingface.co
Площадкаpureportal.spbu.ru
Площадкаit-world.ru
Площадкаatlas curators

Минутная экспозиция

GigaChat как закрыто-открытая программа русскоязычных foundation models описывает модельную линию, где публичная часть состоит из статьи, открытых карточек моделей и части весов, а промышленная часть остается частично закрытой.

Основной технический ход публичной линии - русскоязычная LLM-семья с MoE-архитектурой, предобучением, инструкционной настройкой и оценкой на русских и английских бенчмарках.

Открытые карточки GigaChat-20B-A3B-base и GigaChat-20B-A3B-instruct-bf16 показывают переносимый инженерный слой: модель можно загружать через Transformers, vLLM или SGLang, а карточки фиксируют лицензию MIT, контекст 131 тысяча токенов и связь со статьей.

Полные обучающие корпуса, фильтрация, закрытые производственные версии, политика безопасности, внутренние наборы оценки и реальные промышленные внедрения не раскрыты.

Ключевые конструкты

ИндексМеткаТипСемантика
K001Русскоязычная LLM-семья Сжатая редакторская передача авторской семантики без добавления новой интерпретации.GigaChat Family описана как семейство моделей, специально ориентированных на русский язык и двуязычные русско-английские оценки.
K002MoE-архитектура Сжатая редакторская передача авторской семантики без добавления новой интерпретации.Статья выносит Mixture of Experts в заглавие, а карточка базовой модели уточняет, что модель имеет 20 миллиардов общих параметров и около 3 миллиардов активных параметров во время вывода.
K003Базовая модель Сжатая редакторская передача авторской семантики без добавления новой интерпретации.GigaChat-20B-A3B-base предъявлена как открытая базовая модель с MIT-лицензией, 131 тысячей токенов контекста, safetensors-весами, бенчмарками и примерами запуска.
K004Инструкционно-настроенная модель Сжатая редакторская передача авторской семантики без добавления новой интерпретации.GigaChat-20B-A3B-instruct-bf16 предъявлена как BF16-вариант семейства с чат-шаблоном, примерами запуска и связью с базовой линией.
K005Системная демонстрация Сжатая редакторская передача авторской семантики без добавления новой интерпретации.Статья фиксирует демонстрационные поверхности ведущих моделей через API, Telegram-бот и Web-интерфейс.
K006NeONKA Редакторская реконструкция из корпуса; прямой авторской дефиниции в обработанных источниках нет.Ранний публичный конструкт GigaChat как мультимодального ансамбля; он требует отдельного мостового источника для точного отношения к линии GigaChat Family 2025 года.

Основания и обязательства

  • Онтология публичного слоя инженерная: основными объектами описания выступают архитектура модели, предобучение, настройка, бенчмарки, интерфейсы и веса.
  • Эпистемический контур закрыто-открытый: статья, DOI/arXiv-запись, университетская индексация и карточки моделей дают проверяемую публичную часть, а производственные версии и значимые процедуры обучения остаются вне открытого корпуса.
  • Сильные архитектурные выводы о закрытом промышленном контуре не делаются: открытые карточки моделей поддерживают публичную линию 20B-A3B, но не раскрывают полный производственный стек GigaChat.

Операционная состоятельность

  • Уровень O3 .
  • Операционные конструкции адресованы инженерам и исследователям: открытые карточки моделей дают команды загрузки и запуска моделей через Transformers, vLLM, SGLang и Docker Model Runner.
  • Статья фиксирует не только текстовое описание, но и демонстрационные поверхности ведущих моделей через API, Telegram-бот и Web-интерфейс.
  • Уровень O3 относится к публично предъявленной модельной программе и открытым артефактам; он не означает полной воспроизводимости закрытого промышленного контура.

Зрелость

  • Зрелость: применяемая теория.
  • Программа имеет исследовательскую публикацию, DOI/arXiv-фиксацию, независимую университетскую индексацию, открытые карточки моделей, бенчмарки, веса и демонстрационные поверхности.
  • Прикладная зрелость поддержана модельными артефактами, которые могут использоваться вне команды GigaChat, и продуктово-демонстрационными интерфейсами, указанными в статье.
  • Ограничение зрелости связано не с отсутствием применения, а с неполной прозрачностью: закрытые обучающие данные, фильтрация, согласование поведения модели, оценка безопасности и детали проприетарного внедрения не раскрыты в публичном слое.

Прототипы и инженерные реализации

  • GigaChat-20B-A3B-base: открытая базовая MoE-модель с MIT-лицензией, примерами запуска, бенчмарками и 131 тысячей токенов контекста; статус - открытый модельный артефакт.
  • GigaChat-20B-A3B-instruct-bf16: открытый инструкционно-настроенный BF16-вариант с чат-шаблоном и примерами запуска; статус - открытый модельный артефакт.
  • API, Telegram-бот и Web-интерфейс: демонстрационные поверхности ведущих моделей GigaChat, названные в статье; статус - публично засвидетельствованная системная демонстрация, внутреннее устройство закрыто.
  • Слой NeONKA/SberBoom: исторический публичный след мультимодального ансамбля GigaChat с SFT/RLHF и интеграцией Kandinsky; статус - ранний контекстный инженерный след, требующий отдельной сверки с линией GigaChat Family.

Связанные профили

не обнаружено

Корпус и свидетельства

IDАвторыЗаглавие и источникДата доступа
E001team, GigaChatGigaChat Family: Efficient Russian Language Modeling Through Mixture of Experts Architecture doiDOI-статья2026-05-16
E002Hugging Face Papers: GigaChat Family сайтСайт2026-05-16
E003GigaChat Family сайтСайт2026-05-16
E004ai-sageai-sage/GigaChat-20B-A3B-base репоРепозиторий2026-05-16
E005ai-sageai-sage/GigaChat-20B-A3B-instruct-bf16 репоРепозиторий2026-05-16
E006Сбер встроил GigaChat в Салют на умных колонках SberBoom статьяСтатья2026-05-16
E007Internal atlas discovery note локЗакрытый локальный материал

Состояние профиля

  • Профиль выставлен как рабочий: корпус поддерживает осторожную публичную реконструкцию GigaChat как закрыто-открытой русскоязычной программы базовых моделей с открытыми исследовательскими и модельными артефактами и закрытым промышленным слоем.
  • Утверждения об открытых моделях 20B-A3B поддержаны публичными карточками моделей; производственные версии GigaChat, обучающие корпуса, фильтрация, политика безопасности, внутренние оценки и детали внедрения остаются ограниченной зоной.
  • NeONKA оставлена как исторический публичный след и кандидат на alias, а не как доказательство того, что ансамбль 2023 года и статья GigaChat Family 2025 года описывают одну неизменную архитектуру.
  • Авторская сверка не проводилась; более сильный статус требует уточнения от держателя источников или публичного технического мостика к закрытому промышленному слою.
Наверх