OpenAI представила новую агентную функцию для ChatGPT под названием «глубокое исследование». Компания утверждает, что эта функция может работать автономно, планируя и выполняя многошаговые операции для поиска необходимой информации, отступая и адаптируясь к информации в реальном времени, где это необходимо.
Вместо обычной генерации текста, эта функция отображает краткое описание процесса в боковой панели. Это описание включает ссылки и резюме, показывающее, каким образом производился поиск информации.
Пользователи могут задавать вопросы с использованием текста, изображений и дополнительных файлов, таких как PDF или таблицы, чтобы добавить больше контекста. После этого система тратит от 5 до 30 минут на подготовку ответа, который отображается в окне чата. В будущем обещано, что будут включены встроенные изображения и диаграммы. В OpenAI также упоминают о существующих ограничениях «глубокого исследования», замечая, что система иногда может придумывать факты, путаться в авторитетности информации и не всегда уметь оценивать уровень уверенности в ответе.
Разработка инструментов генеративного ИИ с целью сделать их более полезными и оправдать их стоимость является будущим, обещанным компаниями вроде OpenAI. Они утверждают, что «глубокое исследование» может работать на уровне исследовательского аналитика. Демонстрационное видео начинается с запроса информации об изменениях в розничной торговле за последние три года, на который предоставляется ответ в виде маркированных пунктов и таблиц.
Эта функция появилась вскоре после запуска OpenAI инструмента под названием Operator, который может использовать веб-браузер для выполнения задач, аналогичных тем, которые демонстрировала исследовательская прототипная разработка Project Mariner от Google. Инструмент Google пока недоступен для общественности, но «глубокое исследование» запускается с версией, оптимизированной для профессиональных пользователей.
OpenAI предлагает до 100 запросов в месяц за ежемесячную плату в $200 и «ограниченный доступ» для пользователей Plus, Team и в дальнейшем для Enterprise. Они отмечают, что функция является вычислительно интенсивной, требующей больше ресурсов для выполнения более длительных исследований. В будущем все платные пользователи получат более высокие лимиты, когда станет доступна более быстрая и экономичная версия.
Пресс-релиз OpenAI сообщает, что модель, поддерживающая «глубокое исследование», достигла нового рекорда по точности на AI-бенчмарке под названием «Последний экзамен человечества». Модель OpenAI для «глубокого исследования» достигла точности 26.6% с включенными средствами для поиска и Python-инструментами, что значительно выше 3.3% GPT-4o, и следующей по результативности модели o3-mini (высокая), оцениваемой только по тексту, с 13% точности.
Источник: TheVerge