Отсутствие узбекского языка в меню или интерфейсе иностранной техники, оборудования или программы вызывает определенный дискомфорт у местных пользователей. Не всегда можно разобраться в хитроумных режимах и функциях, заложенных производителем, даже если прилагаемая инструкция написана на твоем родном языке. Сложнее вдвойне, когда она на незнакомом или малознакомом языке.

Узбекским потребителям хорошо знакома эта проблема. Производители техники и софта сконцентрировались на девяти самых распространенных в мире языках – китайском, испанском, английском, хинди, арабском, бенгальском, португальском, русском и японском. На их региональную политику влияют и объемы продаж в каждой конкретной стране. К примеру, бенгальский язык занимает шестое место в мире по количеству носителей, но большинство цифровой продукции на него не локализуется. 

Чтобы преодолеть языковой барьер производители техники и софта придумали универсальную систему символов. Каждая компания пытается сделать меню своих систем интуитивным, чтобы в них смогли разобраться люди, не знающие конкретного языка. Для этого им достаточно будет понимать универсальные символы. Принцип работает, пока потребитель не сталкивается со специфическими операциями. 

К примеру, сегодня во всех супермаркетах Ташкента используются «умные» весы. Потребитель может самостоятельно взвесить покупку, ввести ее код, а весы посчитают сумму и распечатают ценник. Процедура очень проста, пока не доходит до распечатки ценника. Для этого нет универсального символа, да и знакомых слов на английском здесь не найдешь. Цвет кнопок тоже ни о чем не говорит. Только из-за этого потребителям раз за разом приходится звать продавца для взвешивания продуктов. 

С языковым барьером сталкиваются и местные министерства, предприятия, цеха и заводы при покупке иностранного оборудования и техники. Некоторым даже приходится организовывать краткосрочные языковые курсы для своих сотрудников. Такие меры просто необходимы, если сотруднику предстоит эксплуатировать дорогостоящую иностранную технику или сложные программы.   

Своим положением в языковом рейтинге недовольны и итальянцы. Недавно жителей Апеннинского полуострова возмутило, что последние, готовящиеся к релизу компьютерные игры никто не планирует переводить на их родной язык. Они пригрозили, что если подобное отношение продолжится, то они перестанут покупать игровые новинки.     

Свое отношение к языковой политике игровых компаний не раз высказывали и русскоязычные пользователи онлайн-сервиса цифрового распространения компьютерных игр и программ Steam. 

25 августа 2021 года на консолях Xbox, PlayStation и персональных компьютерах вышла игра Psychonauts 2. Игру перевели на французский, итальянский, немецкий, испанский, бразильский и португальский языки. Отсутствие локализации возмутило русскоязычных и китайских игроков, и они начали занижать рейтинг Psychonauts 2 на Metacritic. 27 августа 2021 года рейтинг игры на агрегаторе упал до 3,7 балла из 10, но к 29 числу вырос до 4,3 балла. При этом негативные отзывы об отсутствии поддержки русского языка пока не удалили. Стоит отметить, что Psychonauts 2 – это неплохая игра с увлекательным геймплеем. 

Проблему локализации может решить машинный перевод, но и здесь не все так просто. Эта технология появилась более двадцати лет назад и все эти годы совершенствовалась. Сейчас в нее интегрируют возможности искусственного интеллекта и машинное обучение. Лидерами в этой сфере можно считать компании Google и «Яндекс». Они постоянно проводят исследования, и их языковые базы больше, чем у кого-либо. 

Летом 2021 года «Яндекс» протестировал свою технологию машинного перевода видео. После успешных испытаний поисковик открыл технологию для массового использования. Теперь каждый может посмотреть с русской озвучкой практически любой англоязычный ролик.

За последние десять лет разработчики действительно сильно продвинулись вперед в машинном переводе. Практически любой грамотно составленный текст на языках стран Европы можно перевести на русский через сервисы Google и «Яндекс». Полученный текст практически не будет нуждаться в редактировании, настолько хорошо машины научились понимать европейские языки. Что касается узбекского, здесь все не так радужно. Невозможно найти электронные устройства или сервисы, которые корректно распознают и воспринимают узбекскую речь и язык в целом. Даже последние технические решения от «Яндекс» или Google не всегда отличают узбекский язык от других родственных ему, а качество машинного перевода оставляет желать лучшего. 

Онлайн-переводчики начали переводить с узбекского относительно недавно. Первоначально они воспринимали только тексты на латинице, кириллица была добавлена позже. При этом они адекватно переводят только отдельные слова и словосочетания. Когда нужно перевести целые предложения или большой объем текста, возникают проблемы. Машина просто игнорирует непонятные ей предложения и выбрасывает их из конечного текста. Переводчик может и вовсе перепутать языки и начать перевод с таджикского. 

Поэтому ПРООН в Узбекистане на базе краудсорсингового проекта Mozilla Common Voice запустило инициативу UzbekVoice.ai – открытую базу узбекской речи, используемую для машинного обучения. Это должно устранить нехватку голосовых данных на узбекском языке, которая мешает развитию локальных стартапов и инновационных проектов. 

Чтобы принять участие в проекте, пользователям, говорящим по-узбекски, необходимо отправить свой голос в языковую базу Mozilla Common Voice. Она будет использоваться, чтобы научить алгоритмы искусственного интеллекта понимать узбекскую речь и расширять ее применение.

Проблема языковой локализации некуда не денется, если не принимать соответствующих мер. Производители будут экономить на переводе, а машины так и не научатся грамотно воспринимать узбекский язык.

Роман БОНДАРЧУК,

УзА

 

Русский
Chinese
Turkish
Tajik
Kyrgyz
Turkmen
Japanese
Arabic
English
French
Spanish
Русский
German
Ўзбек
Oʻzbek
Қазақ
Когда машины научатся понимать узбекский язык?

Отсутствие узбекского языка в меню или интерфейсе иностранной техники, оборудования или программы вызывает определенный дискомфорт у местных пользователей. Не всегда можно разобраться в хитроумных режимах и функциях, заложенных производителем, даже если прилагаемая инструкция написана на твоем родном языке. Сложнее вдвойне, когда она на незнакомом или малознакомом языке.

Узбекским потребителям хорошо знакома эта проблема. Производители техники и софта сконцентрировались на девяти самых распространенных в мире языках – китайском, испанском, английском, хинди, арабском, бенгальском, португальском, русском и японском. На их региональную политику влияют и объемы продаж в каждой конкретной стране. К примеру, бенгальский язык занимает шестое место в мире по количеству носителей, но большинство цифровой продукции на него не локализуется. 

Чтобы преодолеть языковой барьер производители техники и софта придумали универсальную систему символов. Каждая компания пытается сделать меню своих систем интуитивным, чтобы в них смогли разобраться люди, не знающие конкретного языка. Для этого им достаточно будет понимать универсальные символы. Принцип работает, пока потребитель не сталкивается со специфическими операциями. 

К примеру, сегодня во всех супермаркетах Ташкента используются «умные» весы. Потребитель может самостоятельно взвесить покупку, ввести ее код, а весы посчитают сумму и распечатают ценник. Процедура очень проста, пока не доходит до распечатки ценника. Для этого нет универсального символа, да и знакомых слов на английском здесь не найдешь. Цвет кнопок тоже ни о чем не говорит. Только из-за этого потребителям раз за разом приходится звать продавца для взвешивания продуктов. 

С языковым барьером сталкиваются и местные министерства, предприятия, цеха и заводы при покупке иностранного оборудования и техники. Некоторым даже приходится организовывать краткосрочные языковые курсы для своих сотрудников. Такие меры просто необходимы, если сотруднику предстоит эксплуатировать дорогостоящую иностранную технику или сложные программы.   

Своим положением в языковом рейтинге недовольны и итальянцы. Недавно жителей Апеннинского полуострова возмутило, что последние, готовящиеся к релизу компьютерные игры никто не планирует переводить на их родной язык. Они пригрозили, что если подобное отношение продолжится, то они перестанут покупать игровые новинки.     

Свое отношение к языковой политике игровых компаний не раз высказывали и русскоязычные пользователи онлайн-сервиса цифрового распространения компьютерных игр и программ Steam. 

25 августа 2021 года на консолях Xbox, PlayStation и персональных компьютерах вышла игра Psychonauts 2. Игру перевели на французский, итальянский, немецкий, испанский, бразильский и португальский языки. Отсутствие локализации возмутило русскоязычных и китайских игроков, и они начали занижать рейтинг Psychonauts 2 на Metacritic. 27 августа 2021 года рейтинг игры на агрегаторе упал до 3,7 балла из 10, но к 29 числу вырос до 4,3 балла. При этом негативные отзывы об отсутствии поддержки русского языка пока не удалили. Стоит отметить, что Psychonauts 2 – это неплохая игра с увлекательным геймплеем. 

Проблему локализации может решить машинный перевод, но и здесь не все так просто. Эта технология появилась более двадцати лет назад и все эти годы совершенствовалась. Сейчас в нее интегрируют возможности искусственного интеллекта и машинное обучение. Лидерами в этой сфере можно считать компании Google и «Яндекс». Они постоянно проводят исследования, и их языковые базы больше, чем у кого-либо. 

Летом 2021 года «Яндекс» протестировал свою технологию машинного перевода видео. После успешных испытаний поисковик открыл технологию для массового использования. Теперь каждый может посмотреть с русской озвучкой практически любой англоязычный ролик.

За последние десять лет разработчики действительно сильно продвинулись вперед в машинном переводе. Практически любой грамотно составленный текст на языках стран Европы можно перевести на русский через сервисы Google и «Яндекс». Полученный текст практически не будет нуждаться в редактировании, настолько хорошо машины научились понимать европейские языки. Что касается узбекского, здесь все не так радужно. Невозможно найти электронные устройства или сервисы, которые корректно распознают и воспринимают узбекскую речь и язык в целом. Даже последние технические решения от «Яндекс» или Google не всегда отличают узбекский язык от других родственных ему, а качество машинного перевода оставляет желать лучшего. 

Онлайн-переводчики начали переводить с узбекского относительно недавно. Первоначально они воспринимали только тексты на латинице, кириллица была добавлена позже. При этом они адекватно переводят только отдельные слова и словосочетания. Когда нужно перевести целые предложения или большой объем текста, возникают проблемы. Машина просто игнорирует непонятные ей предложения и выбрасывает их из конечного текста. Переводчик может и вовсе перепутать языки и начать перевод с таджикского. 

Поэтому ПРООН в Узбекистане на базе краудсорсингового проекта Mozilla Common Voice запустило инициативу UzbekVoice.ai – открытую базу узбекской речи, используемую для машинного обучения. Это должно устранить нехватку голосовых данных на узбекском языке, которая мешает развитию локальных стартапов и инновационных проектов. 

Чтобы принять участие в проекте, пользователям, говорящим по-узбекски, необходимо отправить свой голос в языковую базу Mozilla Common Voice. Она будет использоваться, чтобы научить алгоритмы искусственного интеллекта понимать узбекскую речь и расширять ее применение.

Проблема языковой локализации некуда не денется, если не принимать соответствующих мер. Производители будут экономить на переводе, а машины так и не научатся грамотно воспринимать узбекский язык.

Роман БОНДАРЧУК,

УзА