Компания IBM использовала для обучения своих систем распознавания лиц около миллиона фотографий из базы фотохостинга Flickr без разрешения их авторов или изображенных на них людей, сообщает телеканал NBC.
Для своей работы сотрудники IBM пользовались частью базы Flickr на 100 млн фотографий, которую Yahoo (владевшая фотохостингом в то время) опубликовала в 2014 году специально для исследований.
Изображения были защищены лояльными к пользователям лицензиями Creative Commons, которые, однако, не учитывают такие деликатные вопросы, как обучение алгоритмов распознавания, утверждает The Verge.
По мнению специалистов, едва ли все запечатленные лица согласны на такое использование своих изображений, и они, скорее всего, даже не догадываются о происходящем. Эксперты опасаются, что это может привести к злоупотреблениям и, например, к распределению людей по этническому признаку и занесению некоторых из них в особые базы.
Представители IBM отметили, что снимки в базе были общедоступны, а в самой компании доступ к ней имел ограниченный круг исследователей. Кроме того, заинтересованные пользователи могут сделать запрос на удаление своих изображений с соответствующей ссылкой.
Это может быть затруднительно, так как сама база IBM закрыта, однако сотрудники NBC опубликовали специальную форму, с помощью которой по нику во Flickr можно проверить, используются ли фотографии компанией IBM.
Недавно стало известно, что российские торговые центры и супермаркеты начнут использовать технологию распознавания лиц для изучения потока покупателей. Кроме того, ее внедрят в систему наблюдения за улицами Москвы. Ранее «Афиша Daily» разбиралась, как эта технология работает.