перейти на мобильную версию сайта
да
нет

Классика жанра

Новости машинного перевода с латыни

архив

Гугловский переводчик — что называется, non vulva em non Rubram Legionem

Давным-давно, когда моя жизнь напоминала еще не книгу Тоби Янга, а «Кондуит и Швамбранию», главными фетишами в нашем кругу считались панталоны девочки Кати из соседнего класса и подстрочник к «Запискам о Галльской войне» Гая Юлия Цезаря. Владеть подстрочником в то время было так же престижно, как сейчас первым изданием «Евгения Онегина» или билетами на Коэна.

Поэтому, когда мне сказали, что «Гугл» за­пустил переводчик с латинского на русский, урду и еще пару десятков языков, я расстроился, как еврей, который в одиночку рыл туннель под Ла-Маншем, а дорыв до Англии, обнаружил, что между Лондоном и Парижем уже ходят «Евростары».

Печаль была недолгой: переводчик оказался посредственным. Возьмем, к примеру, Квинта Го­рация Флакка. «Exegi monumentum aere perennius» («Создал памятник я, бронзы литой прочней») превращается после встречи с translate.google.com во «Встроенный памятник прочного бронзы». По­пробуем «Прекрасное далеко». «Mirabile futurum, non esto mihi durum»? «Удивительно будущем, а не на меня, суровым». Может, что-то получится с «Lingua latina non penis caninus est»? «Нет латинского языка собак является наказания».

Казалось бы, как можно настолько плохо переводить тексты с языка, грамматика и лексика которого являют завидный пример внутренней логики, а все главные труды были созданы изрядное количество веков назад?

Дело в том, что Google Translate устроен как нерадивый студент. Сначала он использовал систему SYSTRAN, которая честно пытается провести анализ текста, разложить фразу на субъект и предикат, а потом сконструировать аналог на нужном языке. Сейчас в моде иной подход. «Гугл» прочитал и запомнил миллионы книг и документов вместе с нормальными, человеческими переводами на разные языки. Теперь он сопоставляет новые тексты с подходящими с точки зрения контекста и статистики вариантами. Это метод грубой силы — как перебор словаря в поисках пароля к чужому почтовому ящику.

Лично я этот метод хорошо понимаю. Я и сам руководствовался подобными принципами, когда инквизиторы требовали назвать присутствующий в тексте аблативус, прости господи, абсолютус. «Припоминаю, припоминаю», — говорил я и предлагал несколько вариантов, попадая в цель достаточно часто, чтобы меня оставили в покое и отпустили читать под партой «Заповедник гоблинов».

Понятно, что качество результата, полученного таким ненаучным образом, становится тем менее предсказуемым, чем более странная конструкция стоит на входе. Именно поэтому «Прекрасное далеко» попахивает переэкзаменовкой, а с той же «Галльской войной» «Гугл» справляется на троечку.

Но, в конце концов, какая разница, какую оценку получит на экзамене «Гугл»? Мы любим его уже за то, что его в принципе интересует латынь. Никакое завоевание мира не обходится без сверхидеи, а сверхидеи часто идут рука об руку с классическим образованием. Латынь дает возможность взглянуть на мир с перспективы двух тысячелетий и действовать соответствующе. Именно поэтому «Гугл» велик, а все остальные — жалкие подражатели.

В общем, как сообщает нам в блоге «Гугла» Ingeniarius Programmandi Джейкоб Ужкорейт, на латыни, естественно: «В следующий раз вы найдете Латинской прохода или вам нужна помощь в Латинской писанина, попробуйте это». Кстати, «Ingeniarius Programmandi» «Гугл» переводит как «инженер-программист». Наверное, это из Тацита. А может, из Цицерона.

Ошибка в тексте
Отправить