Почему так происходит
Google Translate и другие онлайн-переводчики учатся языкам, анализируя большое количество текстов и находя в них закономерности. С 2017 года Google использует в работе своего сервиса нейросети. В большинстве случаев это позволяет сильно улучшить качество перевода, но иногда приводит к непредсказуемым результатам.
В первую очередь речь идет о малораспространенных языках вроде креольского или зулу. На этих языках просто не существует достаточно больших корпусов текстов, на которых нейросети будут учиться. В прошлом году пользователи обратили внимание на то, что при переводе случайных слов или даже буквосочетаний с редких языков Google Translate выдает тексты о боге и конце света. Специалисты связывают это с тем, что алгоритм учится на Библии, одном из немногих текстов, доступных на разных языках.
Кроме того, пытаясь перевести с какого‑либо языка текст, который на самом деле написан на другом языке (в данном случае — на русском), алгоритм изо всех сил пытается отыскать в нем знакомые корни и грамматические конструкции. Если языки принадлежат к языковой семье — как, например, русский и украинский или африкаанс и нидерландский, — то дело может выгореть, а в остальных случаях результат непредсказуем. Представьте себе, что вы читаете текст на азербайджанском языке, имея при себе только англо-русский словарь и Библию, — что‑то подобное делает и Google Translate.