Казахстан: Новый стартап представил крупнейшую модель ИИ для распознавания тюркских языков
Стартап «Cybernet AI» представил крупнейшую модель автоматического распознавания речи (ASR) для тюркских языков. Как сообщает Министерство искусственного интеллекта и цифрового развития Республики Казахстан, это первая разработка такого масштаба, созданная в Центральной Азии и первый пример полноценной ИИ-модели, изначально спроектированной под специфику тюркской языковой группы, а не адаптированной из англоязычных решений.
Проект реализован при стратегической поддержке «Astana Hub» и профильного министерства на GPU-инфраструктуре «Microsoft».
– Данная разработка открывает для стран тюркской языковой группы возможность масштабировать цифровые сервисы и клиентское обслуживание на родных языках с применением искусственного интеллекта без потери качества и по доступной стоимости, – прокомментировал управляющий директор «Astana Hub» Танат Ускембаев. – Для страны это означает переход от роли потребителя глобальных ИИ-решений к роли разработчика собственных технологий, конкурентоспособных на международном уровне. Модель создана на базе казахского, турецкого, узбекского, кыргызского, азербайджанского и татарского языков, а также корректно распознает смешанную тюркско-русскую речь – формат, широко распространенный в реальных диалогах клиентов с бизнесом и при получении государственных услуг.
До настоящего времени страны региона Центральной Азии были вынуждены использовать международные ASR-модели, ориентированные прежде всего на английский язык. Такие решения слабо учитывают тюркскую фонетику, акценты и смешанную речь, что ограничивало качество голосовых AI-сервисов.
«Cybernet AI» создал собственную модель внутри региона и для региона, заложив в нее лингвистические особенности современных тюркских языков.
– Мы сознательно отказались от адаптации англоязычных моделей и создали ASR-модель, которая изначально понимает живые, смешанные формы разговорного языка. Это делает разработку не просто очередным технологическим продуктом, а вкладом в формирование локальной экосистемы искусственного интеллекта и технологического суверенитета, – отметил представитель компании Рашид Исмаилов.
Новая ASR-модель ориентирована на бизнес, который работает с большими объемами голосовых коммуникаций: банки и финансовые организации, телеком-операторы, контакт-центры различного уровня, логистические и сервисные компании, государственные структуры, оказывающие услуги населению.
Разработчики модели считают, что она поможет снизить расходы в каналах поддержки клиентов, обеспечив круглосуточную доступность клиентского сервиса в наиболее востребованном голосовом формате. Модель устойчива к шумам, акцентам и переключению языков в одном предложении и демонстрирует одинаково высокую точность в различных сферах применения – от финансовых технологий до государственных услуг.
Г.Хонназаров, УзА