«Антиплагиат» подтвердил, что его детектор сгенерированных текстов можно обойти

18 мая 2023 в 15:54
Shantanu Kumar/Unsplash

Вычисляющий генерацию ChatGPT детектор от «Антиплагиата», запущенный на этой неделе, можно обойти путем «очеловечивания» текста. Об этом «Афише Daily» сообщила пресс-служба компании.

«Антиплагиат» прокомментировал публикацию Александра Жадана, в которой тот описал способ обхода детектора сгенерированного текста. Ранее Жадан смог защитить написанную при помощи чат-бота дипломную работу.

«Антиплагиат» обратил внимание, что Жадан редактировал текст и давал ChatGPT задачу переписать его по несколько раз. «Любое вмешательство человека в сгенерированный ИИ текст, конечно же, „очеловечивает“ его, позволяя обойти алгоритм распознавания», — объяснили в пресс-службе.

В «Антиплагиате» признали, что ChatGPT создает текст «с высоким показателем оригинальности» и умеет «грамотно его оформить». Компания дала советы, как сделать хороший текст в чат-боте, и предупредила о возможных проблемах.

Во-первых, искусственный интеллект великолепно придумывает факты — людей, законы природы и т. д. Объяснить это просто: задача ChatGPT 一 создать текст, похожий на человеческий, а не текст с корректными фактами. В машинных текстах правдивые факты соседствуют с вымышленными данными, об этом нужно знать и не забывать проверять. Так, например, сноски хоть и имеют грамотное оформление, по факту не всегда являются сносками, поскольку ссылаются на несуществующие произведения.

Во-вторых, у чат-бота часто возникают проблемы с логикой, особенно если речь идет о текстах внушительных объемов. Чем больше фрагмент, тем тяжелее генератору сделать его логически безупречным. Получается, что бот выдает при запросе не мысль, а набор слов на заданную тему. В результате текст при достижении определенного размера перестает быть осмысленным и превращается в набор фраз. Работа с небольшими отрывками позволяет это избежать, позволяет контролировать логику.

И, наконец, не все так быстро. Идея, что для создания качественного текста достаточно ввести запрос и щелкнуть мышкой, 一 иллюзия. Чтобы получить добротный текст, придется провести полноценную работу по его созданию. Грамотно поставить генератору задачи, проверить результирующий текст на достоверность, просмотреть все сноски и ссылки 一 все это необходимые условия для качественного результата.
Пресс-служба «Антиплагиата»

В своем комментарии «Антиплагиат» отметил, что Жадан — один из тех, кто потратил «достаточное время на работу с чат-ботом» и получил «пригодный текст».

15 мая «Антиплагиат» запустил детектор сгенерированного текста собственной разработки. Создатели функции заявили, что риск ее ложного срабатывания минимальный. Система анализирует текст на наличие фрагментов, предположительно, созданных с помощью языковых моделей вроде GPT-2, GPT-3 и ChatGPT, и при их нахождении куски работы выделяются, а сам документ маркируется как подозрительный.