Что такое система поиска запрещенного контента «Окулус» и как она работает?

22 февраля 2023 в 18:20
Фото: Westend61/Getty Images
Главный радиочастотный центр Роскомнадзора запустил систему автоматического поиска запрещенного контента «Окулус». Она ищет нарушения закона в фото и видео на сайтах, в чатах и каналах в мессенджерах. «Афиша Daily» попыталась разобраться в том, как это устроено.

Что это за система?

В 2022 году на сайте госзакупок появилась информация о создании системы поиска запрещенного фото- и видеоконтента в интернете «Окулус». Разработчиком стала ИТ-компания Execution RDC. Судя по описанию на сайте, организация ничем подобным ранее не занималась и никогда не была исполнителем по госконтрактам. С 2010 года компания работает в области корпоративного бизнеса: внедряет программное обеспечение, автоматизирует процессы.

На «Окулус» выделили 57,7 миллионов рублей. В техническом задании указано: система должна анализировать переписки в чатах и каналах мессенджеров, надписи, URL-адреса, субтитры, расшифровывать QR-коды. Ее цель — фото и видео, которые можно расценить как популяризацию наркотиков и суицида, распространение детской порнографии, призывы к экстремизму и массовым беспорядкам, дискредитацию ВС РФ, пропаганду ЛГБТ. Глава юридической практики «Роскомсвободы»* Саркис Дарбинян в разговоре с «Aфишей Daily» подчеркивает:

«Система сможет мониторить социальные сети, в том числе стримы».

Как это должно быть устроено: система с помощью компьютерного зрения анализирует материалы, «собранные другими сервисами с конкретных страниц сайтов или же пабликов и профилей в соцсетях». На одну картинку «Окулус» тратит около трех секунд, что позволяет проверять более 200 тысяч материалов в день. При этом сотрудник Роскомнадзора обрабатывает за сутки в среднем 106 изображений и 101 видео. Тестирование системы провели в декабре прошлого года. Сегодня она «выполняет все поставленные задачи», но информацию о первых итогах работы «Окулуса» ГРЧЦ пока не раскрывал.

«Окулус» действительно может просматривать соцсети, личные переписки и контакты, комментарии?

Артем Козлюк

Руководитель общественной организации «Роскомсвобода»*

Мы ранее выявляли тендеры на разработки подобных систем для городских и региональных администраций и правоохранительных органов: «Демон Лапласа», «Фоб», «Мониторинг депрессивного и суицидального поведения у детей и подростков» и другие. Теоретически такие программы могут просматривать комментарии, личные переписки, приватные каналы, если интернет-сервисы передают данные Роскомнадзору. Есть реестр организаторов распространения информации, которые по требованию ФСБ обязаны предоставить данные. В него входят как российские, так и зарубежные сервисы: «ВКонтакте», «Яндекс» («Почта», «Метрика», «Такси» и другие), «Одноклассники», Tinder, YouTube, Telegram. Они обязаны собирать, хранить и предоставлять информацию: не только метаданные, но и IP-адрес, геолокацию, внутреннюю переписку, файлы и контакты.

Слежка идет не только через сервисы, но и через провайдеров. Согласно «пакету Яровой»Два законопроекта, принятые в 2016 году. Среди прочего, они обязывают операторов связи хранить переписку, телефонные звонки и исходящий трафик всех российских пользователей, а также предоставлять эти данные по запросу спецслужб. компании обязаны предоставлять трафик и хранить данные пользователя. Надзор можно минимизировать, используя протокол HTTPS или VPN. Запрещенные в России иностранные соцсети не интегрированы в отечественную систему слежки и не передают спецслужбам информацию.

Как система соотносится с законом?

Саркис Дарбинян

Глава юридической практики общественной организации «Роскомсвобода»*

Вероятно, система будет не только находить запрещенные изображения и символику в миллионах видео, но и сопоставлять их с аккаунтами в соцсетях, с информацией, указанной в личных профилях. В таком случае работа системы должна регулироваться законом № 152 о персональных данных. В нем есть 10-я статья, которая запрещает обрабатывать такие категории данных: взгляды, касающиеся расовой и национальной принадлежности, политики, религиозных или философских убеждений, состояния здоровья, интимной жизни. При этом есть оговорка: информацию можно обрабатывать без согласия человека, если это угрожает безопасности России. Разъяснения по этому поводу может дать лишь независимый суд и сам Роскомнадзор как уполномоченный орган. Однако вряд ли стоит всерьез рассчитывать, что ведомство, будучи и регулятором, и заказчиком системы, накажет само себя.

Будут ли передавать полученные данные правоохранительным органам?

«Окулус» не собирает данные, а только их классифицирует, отмечает гендиректор компании «Социальная лаборатория» Наталия Тылевич. Глава Лиги безопасного интернета Екатерина Мизулина пояснила, что после программы данные будут обрабатывать вручную, то есть автоматически отправлять их в правоохранительные органы для возбуждения дел и внесения в реестр запрещенных сайтов не будут. При этом Саркис Дарбинян в разговоре с «Афишей Daily» подчеркнул: «Мы ничего не знаем, но, вполне вероятно, доступ по API будут предоставлять третьим лицам, включая сотрудников правоохранительных органов».

Насколько эффективно будет работать система?

Правозащитный проект «Сетевые свободы» отмечает: «Заявление [о запуске „Окулуса“] выглядит как антикризисная пиар-акция ведомства, из локальной сети которого утекли терабайты документов, детально описывающих внутреннюю кухню российской интернет-цензуры и историю автоматизации поиска и блокировки нежелательного контента в интернете, прежде всего — оскорблений Владимира Путина и призывов к протестам». Речь идет о хакерской атаке на сайт Главного радиочастотного центра (структуру Роскомнадзора): белорусские «КиберПартизаны» взломали ГРЧЦ и опубликовали несколько скриншотов документов и переписок сотрудников. Как утверждают хакеры, им удалось скачать около двух терабайт информации. В ведомстве взлом не отрицали, но заверили, что «преступники не получили доступ ни к закрытой информации, ни к критически важной инфраструктуре».

Часть экспертов отнеслась к «Окулусу» скептически: они считают, что за такой короткий срок и на заявленную сумму подобную систему создать нереально. Гендиректор Smart Engines Владимир Арлазаров считает: программу, определяющую нежелательный контент с 90%-ной точностью, сделать можно, но не так быстро.

Как систему по поиску запрещенного контента хотят развивать дальше?

К 2025 году в «Окулус» хотят добавить «новые классы и типы нарушения», функцию определения поз людей и их действий. Программа будет «выявлять запрещенные материалы на нескольких кадрах на видеофрагментах, в сложных рукописных текстах и рисованном контенте».

«Окулус» — не единственная система, которую подведомственный Роскомнадзору ГРЧЦ заказал для выявления нарушений законов в интернете. В 2022 году стало известно о создании «системы раннего выявления точек информационной напряженности в интернет-СМИ и на других сетевых ресурсах» под названием «Вепрь». Она должна охватывать ресурсы с ежедневной аудиторией не менее 1 млн человек и выявлять «распространение фейков, которые создают угрозу причинения вреда жизни и здоровья россиян, имуществу и угрозу массового нарушения общественного порядка и общественной безопасности». «Например, люди боятся аварий газового оборудования, потому что сами часто его используют, поэтому вероятность того, что сообщение о взрыве газа в жилом доме широко разойдется и вызовет волну обсуждения и общественного недовольства, высока, и этот риск как раз и зафиксирует система», — отмечает гендиректор компании «Социальная лаборатория» Наталия Тылевич. Стартовая стоимость проекта составила 60 млн рублей, но в итоге ее уменьшили в два раза. Систему разрабатывает петербургская ИТ-компания «Необит», находящаяся под санкциями США с 2021 года и предоставляющая услуги ФСБ, Минобороны, ФНС и другим ведомствам и госкомпаниям.

«Вепрь» будет работать в связке с «Окулусом» и другой системой Роскомнадзора «Мир». «Мир» собирает сообщения из разных источников и сортирует на тексты, видео, изображения и так далее, «Окулус» анализирует изображения и видео и ищет материалы, запрещенные законодательством, а «Вепрь» исследует тексты и прогнозирует дальнейшее распространение темы. Представитель ГРЧЦ подтвердил «Ведомостям»: «Вепрь» и «Окулус» — это части единой системы мониторинга интернета, разработанной по заказу РКН.

* Общественная организация «Роскомсвобода» признана Минюстом иностранным агентом.