Как работает алгоритм TikTok? Расследование The New York Times

7 декабря 2021 в 18:24
Ivan Radic/Flickr

Газета The New York Times получила внутренний документ TikTok, посвященный тому, как устроен механизм рекомендаций на платформе. Его происхождение подтвердила глава коммуникационного отдела платформы Хилари МакКуайд. Она добавила, что текст был составлен командой разработчиков в Пекине и предназначался сотрудникам компании, которые не работают в технических службах. «Афиша Daily» выбрала главное из статьи NYT.

«Приложение хочет удерживать пользователя настолько долго, насколько это возможно», — сообщает издание. Один из главных показателей, указанных в документе, носит название «удержание» — то, насколько часто юзер возвращается на платформу. Второй — «проведенное время».

«Я получил внутренний документ TikTok, объясняющий алгоритм сервиса. Вот что я узнал», — пишет автор материала Бен Смит

«Алгоритм скорее пытается вызвать у человека зависимость, чем дать ему то, чего он на самом деле хочет», — заявляет один из опрошенных газетой экспертов, основатель исследовательской группы Algo Transparency Гийом Шасло.

The New York Times приводит формулу, по которой алгоритм принимает решение о показе того или иного видео. В ней суммируются предсказания ИИ и реальное поведение пользователя с опорой на четыре типа данных: лайки, комментарии, время просмотра и сам факт того, проигрывалось видео или нет. В упрощенном виде она выглядит так: Plike X Vlike + Pcomment X Vcomment + Eplaytime X Vplaytime + Pplay X Vplay.

«Рекомендательная система назначает рейтинг каждому видео, основываясь на этом уравнении, и показывает пользователям те, что набрали наивысший балл. <…> Для краткости уравнение представлено в значительно сокращенном виде — однако его логика совпадает с исходной», — говорится в документе.

В статье NYT также указано, что алгоритм соцсети ставит в приоритет разнообразие контента, а не фиксацию на одной и той же теме. «Если пользователю нравится определенный тип видео и платформа продолжает предлагать именно его, юзеру становится скучно, и он закрывает приложение», — сообщается в документе TikTok. Чтобы этого не происходило, сервис может показывать «принудительную рекомендацию», чтобы человек взаимодействовал с другим типом контента.

Среди множества прочих показателей издание выделяет так называемый уровень качества создаваемого контента («creation quality»). Он рассчитывается с опорой на «частоту создания» («publish rate»), «частоту возвратов» («creator retention») и «монетизацию» («creator monetization»). Издание не уточняет, как рассчитываются последние, но указывает: то, насколько авторы видео успешны в рамках платформы, влияет на рекомендательные алгоритмы.

Еще один собеседник The New York Times, профессор Калифорнийского университета в Сан-Диего Джулиан МакОли, описал алгоритм как «абсолютно разумный, но традиционный». По его словам, преимущество платформы в комбинации ИИ с «потрясающими объемами данных, очень вовлеченными пользователями и средой, в которой они согласны потреблять рекомендованный контент». «Это не магия, созданная [исключительно] алгоритмами», — добавил он.