Нейросеть, за которую пришлось оправдываться министру: что известно о KazLLM
Критика Президента
Во время расширенного заседания правительства тема языковой модели KazLLM оказалась в центре внимания. После доклада о развитии отечественных ИИ-решений у Президента Казахстана Касым-Жомарта Токаева возникли вопросы к заместителю премьер-министра — министру искусственного интеллекта и цифрового развития Жаслану Мадиеву.
Глава государства заявил, что, несмотря на официальный запуск, спрос на казахстанскую разработку остаётся низким: пользователи предпочитают зарубежные сервисы, прежде всего ChatGPT. Президент поинтересовался, в чём причина недоработок и почему отечественный продукт пока не стал массовым.
Вице-министр ответил, что в настоящее время разработаны две крупные языковые модели — KazLLM и AlemLLM, которые внедрены более чем в 40 информационных систем, включая eGov AI, а также доступны студентам, стартапам и IT-компаниям. При этом Мадиев подчеркнул, что такие технологии требуют постоянного обновления и совершенствования.
Что такое большая языковая модель
Большая языковая модель (LLM — Large Language Models) — это система искусственного интеллекта, обученная на огромных массивах текстов. Она способна анализировать, генерировать и преобразовывать текст: отвечать на вопросы, писать документы, переводить, суммировать материалы, помогать с программированием и выполнять десятки других задач.
Принцип её работы основан на архитектуре трансформеров — нейросетей, которые выявляют закономерности в тексте и предсказывают наиболее вероятное продолжение фразы. Именно так работают ChatGPT, Gemini, Claude и другие глобальные сервисы.
KazLLM — это аналогичный инструмент с фокусом на казахский язык и локальный контекст.
Как появился проект KazLLM
Создание национальной языковой модели было инициировано на государственном уровне. Разработка стала частью более широкой стратегии по развитию ИИ в Казахстане.
Если в 2019–2023 годах акцент делался на подготовке кадров, запуске образовательных программ и формировании исследовательской базы, то с 2024 года начался этап создания собственных технологических решений.
11 декабря 2024 года KazLLM была официально представлена Президенту. Этот момент обозначил переход от фазы "обучаем специалистов" к фазе "создаём собственные ИИ-продукты".
Что известно о разработке
За созданием сервиса стоял Институт умных систем и искусственного интеллекта (ISSAI) при Nazarbayev University. Для обучения KazLLM формировался масштабный корпус казахского языка.
Сообщалось, что в работе участвовали более 140 специалистов из 26 научных институтов и университетов. Контент охватывал 115 дисциплин — от математики и финансов до истории и медицины.
Разработка велась при участии Министерства науки и высшего образования, Министерства цифрового развития (ныне — Министерства искусственного интеллекта и цифрового развития), а также частных индустриальных партнёров.
Модель ориентирована на казахский язык, но поддерживает также русский и английский.
Проект опубликован в открытом доступе для исследовательского использования (на платформе Hugging Face) с некоммерческой лицензией.
Экосистема вокруг KazLLM
ISSAI не ограничился одной моделью. На базе KazLLM формируется целая линейка решений:
Oylan — мультимодальные модели, способные работать не только с текстом, но и с изображениями и аудио.
Beynele — модели генерации и редактирования изображений по текстовому описанию с учётом казахстанского культурного контекста.
MangiSoz — семейство речевых моделей для распознавания, перевода и синтеза речи.
TilSync — система субтитрирования и перевода в реальном времени.
Mangitas — защищённые серверные решения для государственных органов и крупных компаний, позволяющие использовать ИИ внутри закрытых инфраструктур без передачи данных в зарубежные облака.
Таким образом, хотя бы в теории речь идёт не только о "чат-боте", а о формировании национальной ИИ-экосистемы.
В чём проблема непопулярности
Как отмечают эксперты, причины могут быть комплексными. Это и отсутствие массового пользовательского интерфейса, и скорость обновлений, и недостаточная публичная коммуникация. Нельзя сбрасывать со счетов и так называемый "эффект привычки". Пользователи уже встроили зарубежные ИИ-сервисы в повседневную работу.
По мнению эксперта по ИИ Максата Акпарова, ключевая проблема проекта не в уровне инженеров и не в технологической базе, а в изначально заданной рамке ожиданий.
Он поясняет: когда государство объявляет о запуске национальной языковой модели, аудитория автоматически начинает сравнивать её с глобальными лидерами — ChatGPT, Gemini и другими системами, за которыми стоят многомиллиардные инвестиции, десятки тысяч графических процессоров и годы непрерывной доработки.
"Это примерно как выпустить первый отечественный электромобиль и сразу сравнивать его с Tesla последнего поколения", — говорит он.
Отдельно эксперт объясняет, почему казахстанцы продолжают пользоваться зарубежными сервисами и не спешат переходить на локальный.
"Рядовой пользователь не думает о цифровом суверенитете или стратегической независимости. Его критерии предельно просты: быстро ли отвечает система, понимает ли контекст, можно ли ей доверять в работе. Если по этим параметрам продукт выглядит менее зрелым, доверие падает очень быстро", - считает Акпаров.
При этом эксперт подчёркивает: сама идея национальной модели абсолютно оправдана.
"Такая модель стране нужна. Но её не стоит позиционировать как "наш ответ мировым лидерам". Это создаёт завышенные ожидания и почти неизбежное разочарование. Гораздо честнее было бы сразу обозначить фокус: это инструмент для государственных задач, для казахского языка, для локальных сценариев. В этом случае и оценка со стороны общества была бы иной", — отмечает он.
Также эксперт обращает внимание на вопрос коммуникации. По его мнению, сейчас проект воспринимается как преимущественно административная инициатива.
Обществу, говорит эксперт, не хватает:
открытых сравнительных тестов,
прозрачных метрик качества,
понятных прикладных кейсов,
регулярного публичного отчёта о прогрессе,
живого диалога с профессиональным сообществом.
"Доверие к ИИ формируется через повторяемость качества и прозрачность. Если этого нет, продукт остаётся в статусе "государственного проекта", а не становится массовым инструментом", — считает он.
В целом эксперт характеризует текущую ситуацию так:
"KazLLM сегодня выглядит как правильная идея, которая пока не стала сильным продуктом. Все крупные модели проходили через "сырой" этап. Разница в том, что у мировых игроков очень высокая скорость итераций. Вопрос в том, сможет ли национальный проект обеспечить сопоставимую динамику развития".
Также эксперт отметил и слабость информационной поддержки продукта. По его словам, многие казахстанцы до сих пор не знают о KazLLM, а следовательно, не могут оценить отечественную нейросеть по достоинству.
В завершении беседы Максат Акпаров заметил, что для развития локальной нейросети государству нужно понять основную стратегию.
"Нужно честно определить цель: мы строим глобального конкурента или надёжный локальный инструмент?" - говорит эксперт по ИИ.
Эксперт уточняет, что от ответа на этот вопрос во многом зависит и архитектура проекта, и объём инвестиций, и модель управления, и то, как его будут воспринимать пользователи.
Читайте также: “Он хотя бы не орёт“: как ИИ влияет на казахстанский рынок труда и кого сможет заменить