Авторы и предъявление
| Тип | Метка |
|---|---|
| Наименование | GigaChat как закрыто-открытая программа русскоязычных foundation models [E001] |
| Автор | GigaChat team [E001] |
| Автор | ai-sage [E004][E005][E001] |
| Площадка | arXiv [E001] |
| Площадка | huggingface.co [E002][E004][E005] |
| Площадка | pureportal.spbu.ru [E003] |
| Площадка | it-world.ru [E006] |
| Площадка | atlas curators [E007] |
Минутная экспозиция
GigaChat как закрыто-открытая программа русскоязычных foundation models описывает модельную линию, где публичная часть состоит из статьи, открытых карточек моделей и части весов, а промышленная часть остается частично закрытой. [E001][E004][E005]
Основной технический ход публичной линии - русскоязычная LLM-семья с MoE-архитектурой, предобучением, инструкционной настройкой и оценкой на русских и английских бенчмарках. [E001]
Открытые карточки GigaChat-20B-A3B-base и GigaChat-20B-A3B-instruct-bf16 показывают переносимый инженерный слой: модель можно загружать через Transformers, vLLM или SGLang, а карточки фиксируют лицензию MIT, контекст 131 тысяча токенов и связь со статьей. [E004][E005]
Полные обучающие корпуса, фильтрация, закрытые производственные версии, политика безопасности, внутренние наборы оценки и реальные промышленные внедрения не раскрыты. [E001][E007]
Ключевые конструкты
| Индекс | Метка | Тип | Семантика |
|---|---|---|---|
| K001 | Русскоязычная LLM-семья [E001][E003] | ≈Сжатая редакторская передача авторской семантики без добавления новой интерпретации. | GigaChat Family описана как семейство моделей, специально ориентированных на русский язык и двуязычные русско-английские оценки. |
| K002 | MoE-архитектура [E001][E004] | ≈Сжатая редакторская передача авторской семантики без добавления новой интерпретации. | Статья выносит Mixture of Experts в заглавие, а карточка базовой модели уточняет, что модель имеет 20 миллиардов общих параметров и около 3 миллиардов активных параметров во время вывода. |
| K003 | Базовая модель [E004] | ≈Сжатая редакторская передача авторской семантики без добавления новой интерпретации. | GigaChat-20B-A3B-base предъявлена как открытая базовая модель с MIT-лицензией, 131 тысячей токенов контекста, safetensors-весами, бенчмарками и примерами запуска. |
| K004 | Инструкционно-настроенная модель [E005] | ≈Сжатая редакторская передача авторской семантики без добавления новой интерпретации. | GigaChat-20B-A3B-instruct-bf16 предъявлена как BF16-вариант семейства с чат-шаблоном, примерами запуска и связью с базовой линией. |
| K005 | Системная демонстрация [E001] | ≈Сжатая редакторская передача авторской семантики без добавления новой интерпретации. | Статья фиксирует демонстрационные поверхности ведущих моделей через API, Telegram-бот и Web-интерфейс. |
| K006 | NeONKA [E006][E007] | ∴Редакторская реконструкция из корпуса; прямой авторской дефиниции в обработанных источниках нет. | Ранний публичный конструкт GigaChat как мультимодального ансамбля; он требует отдельного мостового источника для точного отношения к линии GigaChat Family 2025 года. |
Основания и обязательства
- Онтология публичного слоя инженерная: основными объектами описания выступают архитектура модели, предобучение, настройка, бенчмарки, интерфейсы и веса. [E001][E004][E005]
- Эпистемический контур закрыто-открытый: статья, DOI/arXiv-запись, университетская индексация и карточки моделей дают проверяемую публичную часть, а производственные версии и значимые процедуры обучения остаются вне открытого корпуса. [E001][E003][E004][E005]
- Сильные архитектурные выводы о закрытом промышленном контуре не делаются: открытые карточки моделей поддерживают публичную линию 20B-A3B, но не раскрывают полный производственный стек GigaChat. [E004][E005][E007]
Операционная состоятельность
- Уровень O3 .
- Операционные конструкции адресованы инженерам и исследователям: открытые карточки моделей дают команды загрузки и запуска моделей через Transformers, vLLM, SGLang и Docker Model Runner. [E004][E005]
- Статья фиксирует не только текстовое описание, но и демонстрационные поверхности ведущих моделей через API, Telegram-бот и Web-интерфейс. [E001]
- Уровень O3 относится к публично предъявленной модельной программе и открытым артефактам; он не означает полной воспроизводимости закрытого промышленного контура. [E001][E004][E005][E007]
Зрелость
- Зрелость: применяемая теория.
- Программа имеет исследовательскую публикацию, DOI/arXiv-фиксацию, независимую университетскую индексацию, открытые карточки моделей, бенчмарки, веса и демонстрационные поверхности. [E001][E002][E003][E004][E005]
- Прикладная зрелость поддержана модельными артефактами, которые могут использоваться вне команды GigaChat, и продуктово-демонстрационными интерфейсами, указанными в статье. [E001][E004][E005]
- Ограничение зрелости связано не с отсутствием применения, а с неполной прозрачностью: закрытые обучающие данные, фильтрация, согласование поведения модели, оценка безопасности и детали проприетарного внедрения не раскрыты в публичном слое. [E001][E007]
Прототипы и инженерные реализации
- GigaChat-20B-A3B-base: открытая базовая MoE-модель с MIT-лицензией, примерами запуска, бенчмарками и 131 тысячей токенов контекста; статус - открытый модельный артефакт. [E004]
- GigaChat-20B-A3B-instruct-bf16: открытый инструкционно-настроенный BF16-вариант с чат-шаблоном и примерами запуска; статус - открытый модельный артефакт. [E005]
- API, Telegram-бот и Web-интерфейс: демонстрационные поверхности ведущих моделей GigaChat, названные в статье; статус - публично засвидетельствованная системная демонстрация, внутреннее устройство закрыто. [E001]
- Слой NeONKA/SberBoom: исторический публичный след мультимодального ансамбля GigaChat с SFT/RLHF и интеграцией Kandinsky; статус - ранний контекстный инженерный след, требующий отдельной сверки с линией GigaChat Family. [E006]
Связанные профили
не обнаружено
Корпус и свидетельства
| ID | Авторы | Заглавие и источник | Дата доступа |
|---|---|---|---|
| E001 | team, GigaChat | GigaChat Family: Efficient Russian Language Modeling Through Mixture of Experts Architecture doiDOI-статья | 2026-05-16 |
| E002 | — | Hugging Face Papers: GigaChat Family сайтСайт | 2026-05-16 |
| E003 | — | GigaChat Family сайтСайт | 2026-05-16 |
| E004 | ai-sage | ai-sage/GigaChat-20B-A3B-base репоРепозиторий | 2026-05-16 |
| E005 | ai-sage | ai-sage/GigaChat-20B-A3B-instruct-bf16 репоРепозиторий | 2026-05-16 |
| E006 | — | Сбер встроил GigaChat в Салют на умных колонках SberBoom статьяСтатья | 2026-05-16 |
| E007 | — | Internal atlas discovery note локЗакрытый локальный материал | — |
Состояние профиля
- Профиль выставлен как рабочий: корпус поддерживает осторожную публичную реконструкцию GigaChat как закрыто-открытой русскоязычной программы базовых моделей с открытыми исследовательскими и модельными артефактами и закрытым промышленным слоем. [E001][E004][E005][E007]
- Утверждения об открытых моделях 20B-A3B поддержаны публичными карточками моделей; производственные версии GigaChat, обучающие корпуса, фильтрация, политика безопасности, внутренние оценки и детали внедрения остаются ограниченной зоной. [E004][E005][E007]
- NeONKA оставлена как исторический публичный след и кандидат на alias, а не как доказательство того, что ансамбль 2023 года и статья GigaChat Family 2025 года описывают одну неизменную архитектуру. [E001][E006]
- Авторская сверка не проводилась; более сильный статус требует уточнения от держателя источников или публичного технического мостика к закрытому промышленному слою.