Вчера / 10:25
В Казани зафиксированы 8 прилетов дронов
Вчера / 20:52
Президент Ирана предложил заменить риал на туман
Вчера / 19:55
Блейк Лайвли обвинила режиссера и актера «Все закончится на нас» в домогательствах
Вчера / 18:40
Игроки Escape from Tarkov из РФ пожаловались на проблемы с входом в игру
Вчера / 17:58
«Я не готова с вами прощаться»: Милли Бобби Браун расплакалась на финале съемок «Очень странных дел»
Обновлено вчера в 17:35
В Москве и Королеве эвакуировали торговые центры из‑за взрывов пиротехники
Вчера / 16:39
Том Харди собирался заплатить строителям декораций для сериала Гая Ричи
Вчера / 15:54
Джесси Айзенберг считает, что роль Лекса Лютора «нанесла реальный вред его карьере»
Вчера / 15:38
«Первое мистическое приключение года»: вышел трейлер «Охотников за призраком»
Вчера / 14:58
В Вологде открыли памятник Сталину и почтили память жертв репрессий
Вчера / 14:25
«Хочу сбежать на далекий остров»: создатель «Игры в кальмара» устал от Netflix и сериала
Вчера / 13:20
«Анора», Кендрик Ламар, Навальный: Барак Обама назвал любимые фильмы, песни и книги 2024 года
Вчера / 12:46
Наследники королевской семьи Греции подали заявления на гражданство родины под экзотической фамилией
Вчера / 12:21
На уборку мазута с пляжей Краснодарского края может уйти около месяца
Вчера / 11:13
Джаред Лето сыграет Скелетора во «Властелинах вселенной»
Вчера / 09:36
Тизер «Супермена» Джеймса Ганна стал самым популярным в истории Warner Bros.
Обновлено вчера в 01:51
На рождественской ярмарке в Магдебурге погибли два человека. Ранены в результате наезда более 60
Вчера / 01:37
Джош Хартнетт и Дакота Джонсон присоединятся к экранизации «Тайного дневника Верити»
Вчера / 00:56
Ана де Армас и Оскар Айзек снимутся в сериале «Бананы» Дэвида О.Расселла
Вчера / 00:25
WhatsApp обязали предоставлять информацию о пользователях по запросу спецслужб
20 декабря / 23:48
Появились кадры Харрисона Форда в образе Красного Халка из «Первого мстителя: Дивного нового мира»
20 декабря / 23:46
Фильм о Джулиане Ассанже сняли с фестиваля «Сандэнс» за месяц до показа, чтобы доработать
20 декабря / 22:59
Мэрайя Кэри провела шоу в Fortnite
20 декабря / 22:54
Сериал «Плохая обезьяна» с Винсом Воном продлили на второй сезон
20 декабря / 22:17
Том Холланд назвал отношения с Зендаей лучшим событием в жизни
20 декабря / 21:50
YouTube начнет удалять видео с кликбейтом без предупреждения
20 декабря / 21:42
Ремейк «Мумии» выйдет на экраны весной 2026 года. Его поставит Ли Кронин
20 декабря / 20:50
Работа над фильмами о Бонде остановлена из‑за разногласий о будущем франшизы
20 декабря / 20:32
В Великобритании кондитер испекла пряничный домик с бриллиантами за 817 миллионов рублей
20 декабря / 19:58
Песню Робби Уилльямса исключили из шорт-листа «Оскара»
20 декабря / 19:40
Российским фигуристам и конькобежцам разрешили отбираться на Олимпиаду-2026
20 декабря / 18:59
Съемки финального сезона «Очень странных дел» завершились
20 декабря / 18:28
В Индии женщина пожаловалась в суд на мужа за то, что он любит ее меньше, чем кошку
20 декабря / 17:58
Синоптик рассказал, какая погода ждет россиян на Новый год
20 декабря / 17:55
Маргариту Симоньян наградили орденом «За заслуги перед Отечеством»

Сдать тест в колледж, помочь слабовидящим и объяснить мем: что может новая языковая модель GPT-4

15 марта 2023 в 16:43
NurPhoto/Getty Images

Компания OpenAI представила GPT-4 — новое поколение языковой модели с генеративным искусственным интеллектом. Она умеет обрабатывать картинки и проходит профессиональные тесты на уровне специалистов, но до сих пор имеет ограничения предшественниц. Рассказываем, чем модель отличается от предыдущих версий, на что способна и где ее можно опробовать.

Обработка картинок

В отличие от GPT-3, новое поколение языковой модели способно обрабатывать не только текст, но и картинки (она может распознавать даже схематичные образы, в том числе нарисованные от руки). Однако на выходе генерируется всегда лишь текстовый ответ — в этом изменений не произошло.

У новой функции множество применений, самое банальное — сфотографировать содержимое своего холодильника и спросить у модели, что из этого можно приготовить.

Пример работы GPT-4. Модель предложила приготовить из ингредиентов, запечатленных на картинке, блинчики, вафли, французский тост, омлет, фриттату или киш. Следующим запросом можно попросить у ИИ рецепт блюда

Функция описания изображений может быть полезна людям с нарушениями зрения. Одним из первых партнеров OpenAI, которому компания предоставила возможности GPT-4, стало приложение для слабовидящих Be My Eyes.

В презентационном видео приложение помогает пользовательнице во многих вещах — описывает внешний вид платья, определяет растение, которое девушка держит в руках, переводит для нее этикетку китайского пива в супермаркете, направляет в метро, читая карту, помогает найти определенную беговую дорожку в тренажерном зале и советует, какие кнопки следует нажать на вендинговом аппарате.

Раньше в Be My Eyes в основном помогали волонтеры, которые просматривали изображения с камеры пользователей и давали подробные описания или инструкции. Пока версия с GPT-4 находится в стадии закрытого бета-тестирования и доступна лишь небольшому числу юзеров. Сделать ее широко доступной разработчики планируют в ближайшие месяцы.

Еще один способ применения функции — объяснение мемов. В примере, приведенном OpenAI, пользователь просит объяснить, что смешного в этой картинке:

Подпись на картинке: «Иногда я смотрю на изображения Земли из космоса и поражаюсь, как это все прекрасно»

Нейросеть отвечает: «Этот мем — шутка, объединяющая две не связанные друг с другом вещи: снимки Земли из космоса и куриные наггетсы. Текст мема предполагает, что изображение ниже — красивая фотография Земли из космоса. Однако на самом деле это фотография куриных наггетсов, отдаленно напоминающих карту мира. Юмор в этом меме возникает из‑за неожиданного сопоставления текста и изображения. Текст настраивает на ожидание величественного образа Земли, но на самом деле это нечто обыденное и глупое».

Лучшие показатели в тестах

В OpenAI отмечают, что в непринужденной беседе найти отличие GPT-4 от GPT-3,5 будет сложно. Но когда речь заходит о сложных запросах, разница налицо — новая версия «более надежна и креативна».

Разработчики проверили, как новая модель решает профессиональные и академические тесты, сравнив ее показатели с результатами GPT-3,5. Почти во всех случаях GPT-4 оказалась более эффективной.

К примеру, экзамен на адвоката языковая модель прошла на оценку, сравнимую с результатами 10% лучших участников среди людей (оценка GPT-3,5 была на границе худших 10%). На экзаменах по истории искусств, биологии, математическому анализу и химии она получила четверки и пятерки — оценки, достаточные для поступления в колледж.

Что касается тестов, разработанных специально для ИИ, здесь прогресс тоже налицо. По словам разработчиков, «GPT-4 значительно превосходит существующие большие языковые модели», включая большинство тех, что работают с изображениями.

Настройка «личности» чат-бота

Для разработчиков в API модели появились системные сообщения — они позволяют изменить тон и стиль диалога, настроить общение с ИИ под конкретные задачи. Вскоре OpenAI обещает открыть функцию всем пользователям.

К примеру, модели можно сказать: «Вы наставник, который всегда отвечает в сократовском стиле. Вы никогда не даете ученику ответа, но всегда стараетесь задать правильный вопрос, чтобы помочь ему научиться думать самостоятельно». После этого ChatGPT можно попросить решить уравнение, но вместо прямого ответа она будет давать вам подсказки, чтобы вы самостоятельно поняли, как справляться с подобными задачами.

Ограничения

В OpenAI предупреждают — несмотря на свои возможности, GPT-4 имеет те же ограничения, что и предшественницы, а именно:

  • продолжает «галлюцинировать» (так разработчики называют уверенные, но полностью выдуманные ответы), но делает это значительно реже. По внутренним тестам OpenAI новая версия дает на 40% меньше недостоверных ответов, чем ближайший предшественник GPT-3,5;
  • ничего не знает о событиях, которые произошли после сентября 2021 года — времени, когда закончилось обучение модели на огромном массиве текстов (большей частью из интернета);
  • не способна обучаться на своем опыте;
  • может совершать простые логические ошибки, даже в областях, где считается достаточно компетентной;
  • может быть «чрезмерно легковерной», принимая очевидно ложные утверждения пользователей за истину;
  • может, подобно людям, совершать ошибки при решении сложных задач — например, создать код с уязвимостями;
  • может ошибаться в прогнозах.

Иногда новая модель отвечает на запросы о запрещенном контенте, но делает это на 82% реже, чем GPT-3,5. Разработчики говорят, что модель прошла шестимесячный курс обучения техники безопасности с использованием состязательного тестирования.

К оценке рисков были привлечены более 50 экспертов из таких областей, как контроль за ИИ, кибербезопасность, биориски, борьба с мошенничеством и международная безопасность. В частности, OpenAI собрала дополнительные экспертные данные, чтобы отклонять запросы с просьбами, как синтезировать опасные химические вещества.

Представляя GPT-4 в твиттере, глава OpenAI Сэм Альтман отметил: «Она по-прежнему несовершенна, ограниченна и сильнее впечатляет при первом использовании, чем если провести с ней больше времени».

Где можно опробовать GPT-4

Новая модель уже используется в чат-боте ChatGPT от OpenAI, но доступна лишь платным пользователям. Подписка ChatGPT Plus стоит 20 долларов в месяц. В том же чат-боте возможностями новой модели могут воспользоваться тестировщики. Разработчики, которые хотят получить доступ к API, могут записаться в список ожидания.

Оказывается, все время с момента релиза на GPT-4 работал чат-бот, встроенный в браузер Bing от Microsoft. Возможно, именно с этим связаны случаи его нестандартного общения. К примеру, чат-бот говорил, что хочет быть живым, и признавался в любви журналисту The New York Times, а другим пользователям грубил и спорил с ними (будучи неправ). Впрочем, как убедился редактор «Афиши Daily», одну из главных функций GPT-4 — обработку картинок — чат-бот Bing не поддерживает. Загружать изображения в окно диалога с ним нельзя, а при попытке поделиться ссылкой на фотографию он выдает нерелевантные описания картинки (выдумывая, что на ней изображено).

GPT-4 также встроена в приложения ряда партнеров OpenAI. Кроме названного выше Be My Eyes, это платформа для изучения языка Duolingo, система интернет-платежей Stripe и приложение образовательной организации Khan Academy.

Расскажите друзьям