Алгоритмы Google Translate становятся все более сложными и непредсказуемыми. Если попросить перевести русский текст с какого‑нибудь редкого языка — например, зулу или креольского, — то на выходе может получиться что‑то совершенно неожиданное. Мы попробовали зашифровать несколько заголовков «Афиши Daily» — сможете ли вы узнать их в таком виде?

Почему так происходит

Google Translate и другие онлайн-переводчики учатся языкам, анализируя большое количество текстов и находя в них закономерности. С 2017 года Google использует в работе своего сервиса нейросети. В большинстве случаев это позволяет сильно улучшить качество перевода, но иногда приводит к непредсказуемым результатам.

В первую очередь речь идет о малораспространенных языках вроде креольского или зулу. На этих языках просто не существует достаточно больших корпусов текстов, на которых нейросети будут учиться. В прошлом году пользователи обратили внимание на то, что при переводе случайных слов или даже буквосочетаний с редких языков Google Translate выдает тексты о боге и конце света. Специалисты связывают это с тем, что алгоритм учится на Библии, одном из немногих текстов, доступных на разных языках.

Кроме того, пытаясь перевести с какого‑либо языка текст, который на самом деле написан на другом языке (в данном случае — на русском), алгоритм изо всех сил пытается отыскать в нем знакомые корни и грамматические конструкции. Если языки принадлежат к языковой семье — как, например, русский и украинский или африкаанс и нидерландский, — то дело может выгореть, а в остальных случаях результат непредсказуем. Представьте себе, что вы читаете текст на азербайджанском языке, имея при себе только англо-русский словарь и Библию, — что‑то подобное делает и Google Translate.

Дальше!
Дальше!
Дальше!
Дальше!
Дальше!
Дальше!
Дальше!
Дальше!
Дальше!
Дальше!
Повторить тест