Разработка автоматизированных переводчиков – очень сложный и дорогостоящий процесс. Такое под силу только крупным корпорациям, таким как Google и Yandex. Помимо сложных технических задач перед разработчиками встает проблема сбора голосовых данных носителей языка.

Разработка автоматизированных переводчиков ведется уже давно. Их первые версии напоминали обычные электронные словари. За последние десять лет разработчики сильно продвинулись вперед в машинном переводе. Любой текст на языках стран Европы можно перевести на русский через сервисы Google и Yandex. Что касается узбекского, здесь все не так радужно. До недавнего времени было невозможно найти электронные устройства или сервисы, которые корректно распознают и воспринимают узбекскую речь и язык в целом. Недавно Yandex и Google обновили свои переводчики.

Первоначально они воспринимали только тексты на латинице, кириллица была добавлена позже. При этом адекватно переводились только отдельные слова и словосочетания. Когда нужно было перевести целые предложения или большой объем текста, возникали проблемы. Машина просто игнорировала непонятные ей предложения и выбрасывала их из конечного текста. Переводчик даже мог и вовсе перепутать языки и начать переводить с таджикского. 

Языковой барьер «умным» алгоритмам позволила преодолеть только интеграция нейросетей. Неожиданно, свой узбекский в разной степени «подтянули» онлайн-переводчики Yandex и Google. 

В частности, Google перестал путать узбекский с таджикским и значительно повысил качество перевода. А ведь раньше он переводил тексты дословно, даже без учета устойчивых словосочетаний, игнорируя особенности построения предложений на узбекском языке. Теперь же переводы стали логичнее и осмысленнее. Еще дальше в этом направлении продвинулся Yandex переводчик. Нейросеть, используемая российской компанией, не только качественно переводит текст, но и грамотно составляет предложения и целые абзацы. Более того, она перерабатывает и облагораживает неграмотно написанные предложения. Также Yandex  переводчик стал лучше распознавать и переводить картинки и скриншоты с надписями на узбекском. Если раньше подобный перевод позволял узнать только суть написанного, то теперь его можно использовать даже при переводе официальных документов. 

Язык – важный инструмент, благодаря которому мы можем узнавать новое и обмениваться информацией. Конечно, нейросети не могут заменить профессиональных переводчиков. Они по-прежнему непредсказуемы, склоны к выдумыванию фактов и «галлюцинациям». Результаты их деятельности должны проверять квалифицированные специалисты. В частности, поэтому в них вводят различные ограничения. Они касаются стран проживания, пола, национальности, расы, религии, политических убеждений и отдельных защищенных групп населения. Разработчики делают все, чтобы обезопасить себя от возможных ошибок, свойственных современным нейросетям.

Подготовил Роман Бондарчук, УзА.

Русский
Chinese
Turkish
Tajik
Kyrgyz
Turkmen
Japanese
Arabic
English
French
Spanish
Русский
German
Ўзбек
Oʻzbek
Қазақ
Онлайн-переводчики научились понимать узбекский

Разработка автоматизированных переводчиков – очень сложный и дорогостоящий процесс. Такое под силу только крупным корпорациям, таким как Google и Yandex. Помимо сложных технических задач перед разработчиками встает проблема сбора голосовых данных носителей языка.

Разработка автоматизированных переводчиков ведется уже давно. Их первые версии напоминали обычные электронные словари. За последние десять лет разработчики сильно продвинулись вперед в машинном переводе. Любой текст на языках стран Европы можно перевести на русский через сервисы Google и Yandex. Что касается узбекского, здесь все не так радужно. До недавнего времени было невозможно найти электронные устройства или сервисы, которые корректно распознают и воспринимают узбекскую речь и язык в целом. Недавно Yandex и Google обновили свои переводчики.

Первоначально они воспринимали только тексты на латинице, кириллица была добавлена позже. При этом адекватно переводились только отдельные слова и словосочетания. Когда нужно было перевести целые предложения или большой объем текста, возникали проблемы. Машина просто игнорировала непонятные ей предложения и выбрасывала их из конечного текста. Переводчик даже мог и вовсе перепутать языки и начать переводить с таджикского. 

Языковой барьер «умным» алгоритмам позволила преодолеть только интеграция нейросетей. Неожиданно, свой узбекский в разной степени «подтянули» онлайн-переводчики Yandex и Google. 

В частности, Google перестал путать узбекский с таджикским и значительно повысил качество перевода. А ведь раньше он переводил тексты дословно, даже без учета устойчивых словосочетаний, игнорируя особенности построения предложений на узбекском языке. Теперь же переводы стали логичнее и осмысленнее. Еще дальше в этом направлении продвинулся Yandex переводчик. Нейросеть, используемая российской компанией, не только качественно переводит текст, но и грамотно составляет предложения и целые абзацы. Более того, она перерабатывает и облагораживает неграмотно написанные предложения. Также Yandex  переводчик стал лучше распознавать и переводить картинки и скриншоты с надписями на узбекском. Если раньше подобный перевод позволял узнать только суть написанного, то теперь его можно использовать даже при переводе официальных документов. 

Язык – важный инструмент, благодаря которому мы можем узнавать новое и обмениваться информацией. Конечно, нейросети не могут заменить профессиональных переводчиков. Они по-прежнему непредсказуемы, склоны к выдумыванию фактов и «галлюцинациям». Результаты их деятельности должны проверять квалифицированные специалисты. В частности, поэтому в них вводят различные ограничения. Они касаются стран проживания, пола, национальности, расы, религии, политических убеждений и отдельных защищенных групп населения. Разработчики делают все, чтобы обезопасить себя от возможных ошибок, свойственных современным нейросетям.

Подготовил Роман Бондарчук, УзА.