Онлайн-переводчик Google Translate в очередной раз привлек к себе внимание пользователей и СМИ благодаря тому, что перевел «Российская Федерация» с украинского языка на русский как «Мордор». Это далеко не первый случай оскорбления чувств пользователей машинными алгоритмами. Отдел технологий «Газеты.Ru» разобрался в механике их возникновения.
Главное
Что ждет российский интернет в 2016-м
Касперский стал бесплатным
Мороз съедает батарейку
iPhone 6s обошел всех
Самые ожидаемые смартфоны года
Читайте также
Телевизор вновь в центре дома. О 55-дюймовом 4К-представителе нового поколения «умных» телевизоров в обзоре «Газеты.Ru».
Эффективный бизнес иностранным инвесторам мы не продаем
5 отличных рецептов для самых смелых
Во вторник, 5 января, соцсети пестрили публикациями скриншотов, на которых Google Translate переводит словосочетание «Російська Федерація» с украинского на русский как «Мордор», а фамилию «Лавров» — «грустная лошадка».
В Google объяснили, почему Россия, по мнению сервиса-переводчика, вдруг превратилась в вымышленную страну и сосредоточие зла в Средиземье из легендариума Дж. Р.Р. Толкина. В компании заверили, что Google Translate — это автоматический переводчик, работающий без участия людей, но при помощи алгоритмов. Для создания наиболее качественного перевода алгоритмы анализируют огромные массивы документов и публикаций, как оригиналов, так и их переводов, сделанных людьми. О принципе работы переводчика Google подробно рассказывается в данном видео.
В случае если у Google Translate появляется грубая ошибка в переводе, то компания старается незамедлительно справиться с ней, рассказал представитель компании.
Что касается конкретно данной ошибки, из-за которой Россия стала Мордором, то в интернете можно найти множество статей, где «Мордор» и «Россия» используются в одном контексте. Здесь подразумевается и сомнительная теория, согласно которой в образе пристанища Саурона Дж. Р.Р. Толкин изобразил СССР, впоследствии же «титул» перешел к России.
Также тема стала широко обсуждаться, когда в Москве планировалось установить инсталляцию «Око Саурона». Что также вызвало широкий резонанс в СМИ. Журналист Леонид Бершидский в статье для Bloomberg, например, назвал Россию Мордором, а Украину — Широм, родиной хоббитов.
Фамилия «Лавров», наиболее часто упоминающаяся в публикациях СМИ о министре иностранных дел России Сергее Лаврове, могла получить столь странный перевод по схожей причине. Так, ранее в Запорожье был установлен памятник, который представляет российского государственного деятеля в образе лошади. Об этом писали украинские издания, что и привело к тому, что переводчик Google запутался именно в этих двух языках.
Таким образом, алгоритмы Google Translate просто-напросто сбились, анализируя украинские и российские источники. А на фоне обострившихся российско-украинских отношений подобные казусы привели к достаточно нелепым переводам.
Тем не менее сервисы Google уже не раз попадали впросак с использованием собственных алгоритмов.
Одним из самых громких роботизированных оскорблений Google стали запросы «nigger house» и «nigga house», которые выдавали в результатах поиска на Google Maps резиденцию президента США Барака Обамы в Вашингтоне. Причиной таких результатов поиска стала социальная сеть Google+, записи в которой использовались для нанесения и уточнения информации об объектах на картах. В большом количестве из них встречались эти словосочетания.
Поднятая волна критики в СМИ и со стороны обычных американских пользователей заставила компанию оперативно сделать заплатки в алгоритмы, и Белый дом перестал выводиться по этим запросам. Но внимательные пользователи на этом не остановились и нашли еще один запрос — «nigga king», который также указывал на резиденцию Барака Обамы.
Причиной ассоциации Белого дома с оскорбительными запросами стали пользователи Google+
Ранее Google пришлось закрыть функцию добавления пользователями объектов на Google Maps после того, как по определенным географическим координатам на них появилось изображение логотипа Android, справляющего малую нужду на логотип конкурента — Apple.
Этот «географический объект» был добавлен на Google Maps пользователями.
Таким образом, пользователи зачастую сами препятствуют развитию сервисов Google на основе пользовательского контента, и сторонние картографические сервисы, такие как созданная российскими разработчиками Wikimapia.org, получают преимущества на рынке перед таким гигантом, как Google.
Зачастую ляпы алгоритмов выглядят как шутки разработчиков или даже попытки «потроллить». Например, в начале 2010 года Google Translate переводил одну и ту же словесную конструкцию «is to blame» (англ. «виноват») по-разному в контексте России и российского президента и США и американского президента. Для России и Медведева перевод был «виноват», для США и Обамы — «не виноват». Позже различие в переводах в разном контексте было убрано.
В конце 2010 года появился знаменитый перевод фразы: «Доброе утро, Дмитрий Анатольевич!», которая в английском варианте у Google Translate превращалась в «Good morning, Mr President».
Иногда результат работы алгоритмов похож на шуточки разработчиков
Версия с баловством разработчиков, конечно, имеет место быть, но за пять лет подобных случаев транснациональная корпорация, чьи миллиардные прибыли могут быть поставлены под угрозу подобными действиями сотрудников, должна была внести соответствующие изменения в работу с персоналом. Однако «шуточки алгоритмов» продолжают появляться с завидной регулярностью.
В декабре 2015 года Google Translate по-прежнему допускал «дискриминацию» в переводе в зависимости от контекста.
Так, «Россия присоединила» переводилось как «Russia joined», а «россия присоединила» (со строчной буквы «р») — как «Russia annexed», то есть «Россия аннексировала».
При этом для слова «Америка» в той же конструкции заглавная или строчная «а» значения не имела. Можно предположить, что те пользователи интернета, которые считали ситуацию с Крымом «аннексией», могли писать «россия» со строчной «р», выражая тем самым свое неуважение.
Также подобные различия в переводе «joined» в сервисе можно было наблюдать для Франции, Норвегии и Шотландии.
Еще одним уязвимым для действий пользователей сервисом является Google Street View. Google регулярно обновляет снимки городских улиц в разных городах, чтобы изменения местности отражались и в панорамах. Если сейчас курьезы и скандалы чаще связаны с местным колоритом и случайно попавшими на камеру сценами секса на улице, то постепенно сервис становится ареной для самовыражения пользователей и проявления определенной гражданской позиции. Так, австралийские женщины начали демонстрировать машинам Google обнаженную грудь как протест против вторжения корпорации в личную жизнь жителей.
Тем не менее в череде случайностей есть если не позитивные, то полезные примеры. В ноябре прошлого года благодаря Google Street View был обнаружен автомобиль с телом человека, считавшегося пропавшим без вести в течение девяти лет.