Зачем нужен сервис, угадывающий возраст, и чем он для нас опасен
Всю неделю интернет с восторгом испытывал майкрософтовский алгоритм, определяющий возраст человека по фотографии. «Афиша» разобралась в феномене How-old.net — примере того, как прокрастинация поможет когда-нибудь cоздать Skynet.
У Microsoft есть удивительный и довольно загадочный на первый взгляд актив — платформа облачных вычислений Azure. Она способна обсчитывать какие угодно большие данные, а также строить на их основе какие угодно модели или прогнозы. Условно говоря, живущий в Подмосковье пользователь показывает сайту косточку — майкрософтовские серверы в Айове восстанавливают по ней динозавра. Или вот пара реальных экспериментов с витрины сервиса: в одном машины пытаются прикинуть шансы на выживание пассажиров «Титаника», во втором — вероятность похудеть после тех или иных упражнений, в третьем — поведение цен на нефть. Есть там и совсем будничные вещи вроде API, рекомендательной системы для онлайн-магазина.
Облачные вычисления, машинное обучение, большие данные — для большинства пользователей сети все это — параллельная вселенная. Но особенность Azure в том, что это, кажется, первая компьютерная сеть такого масштаба, чьи услуги в теории доступны каждому. То есть за определенную плату вы можете поставить себе на сайт или в приложение, скажем, систему распознавания лиц на фотографиях. Чтобы показать, как просто и быстро это делается, два инженера Microsoft Кор Томпсон и Сантош Баласубраманиан собрали за пару дней сайт How-old.net, угадывающий по фотографии человека его возраст и пол. Они надеялись, что сайт оценят два с половиной программиста, но он тут же превратился громкий интернет-мем.
Спустя несколько часов после запуска на сайт были загружены сотни тысяч фотографий, причем половина из них, как утверждают авторы сервиса, настоящие снимки пользователей, а вовсе не случайные картинки из интернета. В момент выхода этой заметки в фейсбуке и твиттере, вероятно, не останется никого, кто хотя бы мельком не видел упоминания How-old.net и восторгов по поводу того, как робот угадал или не угадал его возраст. Не обошлось и без маленького скандала. Кто-то очень внимательный заметил, что в правилах сервисов Azure Microsoft оговаривает свое право делать с загруженными данными пользователей практически все, что ему захочется. То есть, согласно самым тревожным версиям, компания может использовать их потом для таргетированной рекламы или передать эти снимки в АНБ и еще кому угодно. Пользователи How-old.net действительно оставляют много данных: фотографии, предполагаемый пол и возраст, свое местоположение и прочее. Авторы сайта, правда, успокаивают, что по крайней мере загруженные фото удаляются с серверов сразу после соответствующих расчетов. Но кто это может проверить?
Распознаватель лиц Azure — практическое воплощение алгоритма, придуманного в исследовательском проекте Oxford. С одной стороны, и тот и другой сервис пока почти полностью бесполезны. Откройте демостраницу проекта Oxford и там внизу попробуйте добавить две свои фотографии. Сервис обещает узнать одного и того же человека на разных снимках, но, скорее всего (особенно если человек менял прическу или фотографировался с разных точек), он ошибется. How-old.net тоже называет возраст не точно. И совсем промахивается, когда дело доходит до изображений бородатых молодых людей (хотя пол угадывает верно почти всегда). Иногда алгоритм вообще видит на фотографиях двадцатилетних девушек-призраков. Но, с другой стороны, разработчикам How-old.net удалось добраться до широкой аудитории и, главное, показать, что подобные сложно устроенные системы, которые на деле оказываются не такими уж «умными», можно совершенствовать силой коллективного разума.
Очевидно, что сайту How-old.net не хватает обратной связи — еще одной кнопки, которая бы позволяла пользователям (которых теперь уже миллионы) корректировать его ответы (угадал/не угадал, сколько мне лет на самом деле) и в результате улучшать точность его вердиктов. Таких экспериментов, когда компьютеры учатся у людей видеть окружающее более или менее их глазами, известно немало. Например, постоянно совершенствующийся благодаря пользователям переводчик Google Translate. Или проекты Луиса фон Ана. Его игра ESP Game, где люди соревновались в описании картинок, стала базой для нынешнего поиска изображений Google Images. А придуманная им reCAPTCHA, система защиты от ботов на сайтах, помогает распознавать печатные тексты. Хотя вряд ли кто-то из людей, набирающих бессмысленные капчи, подозревает, что в этот момент он вместе с машинами занимается оцифровкой книг.
И в этом смысле How-old.net — шаг вперед, поскольку никто, похоже, пока не пытался добавить к машинному обучению вирусный эффект в соцсетях и извлечь хоть какую-то пользу из по-человечески понятного желания в очередной раз рассказать о себе миру: «Смотрите, робот угадал мой возраст!» А если не угадал, то еще лучше: жаловаться друзьям даже интереснее. Впрочем, шум вокруг How-old.net скоро поутихнет, и нам только остается фантазировать, какие такие игрушки энтузиасты Azure выпустят в следующий раз. Может быть, сайт c голосовым API, угадывающий, к примеру, акцент пользователя. А может, сайт, предсказывающий вкус вина, — были у них и такие опыты.