«Антиплагиат» научился распознавать текст, сгенерированный с помощью ИИ

15 мая 2023 в 22:24
Jonathan Kemper/Unsplash

В системе обнаружения текстовых заимствований «Антиплагиат» появилась новая функция — выявление текстов, сгенерированных ИИ. Об этом пишет CNews со ссылкой на представителей сервиса.

Новый функционал будет доступен всем платным пользователям сервиса с мая 2023 года. Детектор сгенерированного текста — собственная разработка компании. Система обучена на большом наборе данных, и представители компании говорят, что риск ее ложного срабатывания минимальный.

Система анализирует текст на наличие фрагментов, предположительно созданных с помощью языковых моделей вроде GPT-2, GPT-3 и ChatGPT. При их нахождении фрагменты текста выделяются, а сам документ маркируется как подозрительный.

«Нейронная сеть, создающая текст, всегда оставляет свои следы. В работе над определением сгенерированного текста разработчики компании „Антиплагиат“ также использует алгоритмы искусственного интеллекта, естественно, обученные на задачи детектирования. Несмотря на все успехи ChatGPT или Jasper, их тексты все еще отличаются от написанных человеком», — отметил исполнительный директор компании «Антиплагиат» Юрий Чехович.

Языковые модели, такие как ChatGPT, зачастую используют студенты для написания курсовых и дипломных работ. Первый такой случай в России, который осветили СМИ, произошел в РГГУ в начале года. Студент пятого курса Александр Жадан написал дипломную работу с помощью чат-бота ChatGPT и смог защитить ее на оценку «удовлетворительно». После этого Национальная комиссия по этике в сфере искусственного интеллекта попросила Минобрнауки регламентировать использование ИИ в учебном процессе.

О проблеме использования генеративных моделей в учебе известно и OpenAI — компании, которая разработала ChatGPT. В начале февраля она объявила о запуске инструмента, способного распознавать текст, написанный на основе сгенерированного ИИ материала.