OpenAI представила новую модель GPT-4.1, которая является преемником мультимодальной модели GPT-4o, выпущенной компанией в прошлом году. Во время прямой трансляции в понедельник, OpenAI заявила, что GPT-4.1 обладает еще более широким контекстным окном и превосходит GPT-4o практически во всех аспектах. Модель значительно улучшена в части программирования и следования инструкциям.
Модель GPT-4.1 теперь доступна разработчикам вместе с двумя более компактными версиями моделей. В их числе GPT-4.1 Mini, которая, как и ее предшественник, является более доступной для экспериментов разработчиков, и GPT-4.1 Nano — еще более легкая модель, которую OpenAI называет своей «самой маленькой, быстрой и недорогой».
Все три модели способны обрабатывать до миллиона токенов контекста — текстов, изображений или видео, включенных в запрос. Это заметно больше, чем лимит в 128,000 токенов у GPT-4o. «Мы обучили GPT-4.1 надежно работать с информацией на всем протяжении контекста в 1 миллион токенов», — говорится в публикации OpenAI, а также добавляется, что модель стала значительно более стабильной по сравнению с GPT-4o в части выявления нужного текста и игнорирования отвлекающих факторов как на больших, так и на малых длинах контекста.
Эта новость появилась на фоне планов OpenAI убрать из ChatGPT двухлетнюю модель GPT-4 30 апреля, указав в changelog, что последние обновления GPT-4o делают ее «естественным преемником» для замены. OpenAI также планирует снять с эксплуатации предварительную версию GPT-4.5 в API 14 июля, поскольку «GPT-4.1 предлагает улучшенные или аналогичные показатели эффективности на многих ключевых задачах при значительно меньших затратах и задержках.»
Кроме того, OpenAI готовится выпустить полную версию своей модели рассуждений o3 и минимальную версию o4 любой день, о чем уже имеются упоминания в последнем веб-релизе ChatGPT от инженера по ИИ Тибора Блахо.
Источник: TheVerge