Вычисляющий генерацию ChatGPT детектор от «Антиплагиата», запущенный на этой неделе, можно обойти путем «очеловечивания» текста. Об этом «Афише Daily» сообщила пресс-служба компании.
«Антиплагиат» прокомментировал публикацию Александра Жадана, в которой тот описал способ обхода детектора сгенерированного текста. Ранее Жадан смог защитить написанную при помощи чат-бота дипломную работу.
«Антиплагиат» обратил внимание, что Жадан редактировал текст и давал ChatGPT задачу переписать его по несколько раз. «Любое вмешательство человека в сгенерированный ИИ текст, конечно же, „очеловечивает“ его, позволяя обойти алгоритм распознавания», — объяснили в пресс-службе.
В «Антиплагиате» признали, что ChatGPT создает текст «с высоким показателем оригинальности» и умеет «грамотно его оформить». Компания дала советы, как сделать хороший текст в чат-боте, и предупредила о возможных проблемах.
Во-вторых, у чат-бота часто возникают проблемы с логикой, особенно если речь идет о текстах внушительных объемов. Чем больше фрагмент, тем тяжелее генератору сделать его логически безупречным. Получается, что бот выдает при запросе не мысль, а набор слов на заданную тему. В результате текст при достижении определенного размера перестает быть осмысленным и превращается в набор фраз. Работа с небольшими отрывками позволяет это избежать, позволяет контролировать логику.
И, наконец, не все так быстро. Идея, что для создания качественного текста достаточно ввести запрос и щелкнуть мышкой, 一 иллюзия. Чтобы получить добротный текст, придется провести полноценную работу по его созданию. Грамотно поставить генератору задачи, проверить результирующий текст на достоверность, просмотреть все сноски и ссылки 一 все это необходимые условия для качественного результата.
В своем комментарии «Антиплагиат» отметил, что Жадан — один из тех, кто потратил «достаточное время на работу с чат-ботом» и получил «пригодный текст».
15 мая «Антиплагиат» запустил детектор сгенерированного текста собственной разработки. Создатели функции заявили, что риск ее ложного срабатывания минимальный. Система анализирует текст на наличие фрагментов, предположительно, созданных с помощью языковых моделей вроде GPT-2, GPT-3 и ChatGPT, и при их нахождении куски работы выделяются, а сам документ маркируется как подозрительный.