Meta выпускает две модели искусственного интеллекта Llama 4

06.04.2025

Meta представила новую коллекцию AI-моделей Llama 4, которая теперь используется в ассистенте Meta AI на веб-платформе и в таких приложениях, как WhatsApp, Messenger и Instagram. В эту коллекцию входят две новые модели, которые можно скачать с сайта Meta или через платформу Hugging Face. Модель Llama 4 Scout — это компактная модель, способная работать на одном графическом процессоре Nvidia H100. В то время как Llama 4 Maverick больше соответствует таким мощным моделям, как GPT-4o и Gemini 2.0 Flash. Meta заявляет, что в процессе находится обучение модели Llama 4 Behemoth, о которой генеральный директор Meta Марк Цукерберг говорит, что она является «самой производительной базовой моделью в мире».

По информации Meta, модель Llama 4 Scout обладает контекстным окном в 10 миллионов токенов — это своего рода рабочая память AI-модели. Она превосходит такие модели, как Gemma 3 от Google и Gemini 2.0 Flash-Lite, а также открытую модель Mistral 3.1, и демонстрирует это по множеству общепризнанных показателей, оставаясь при этом компактной и способной работать на одном Nvidia H100 GPU. Подобные утверждения делает компания и относительно более крупной модели Maverick, производительность которой сопоставима с результатами OpenAI GPT-4o и Google Gemini 2.0 Flash, а также DeepSeek-V3 в задачах, связанных с кодированием и логическими рассуждениями, используя при этом менее половины активных параметров.

В то же время Llama 4 Behemoth обладает 288 миллиардами активных параметров и общей численностью параметров в 2 триллиона. Эта модель еще не была выпущена, но Meta утверждает, что Behemoth может превосходить своих конкурентов, таких как GPT-4.5 и Claude Sonnet 3.7, на нескольких научно-технических тестах.

Для Llama 4 компания Meta перешла на архитектуру «смеси экспертов» (MoE), которая позволяет экономить ресурсы, используя только те части модели, которые необходимы для выполнения конкретного задания. Компания планирует обсудить будущие планы по разработке AI-моделей и продуктов на конференции LlamaCon, которая состоится 29 апреля.

Как и предыдущие модели, коллекция Llama 4 объявляется «открытым исходным кодом», хотя она подвергалась критике за лицензионные ограничения. Например, лицензия Llama 4 требует от коммерческих организаций с более чем 700 миллионами активных пользователей в месяц получать разрешение от Meta на использование моделей, что, по мнению Open Source Initiative, «выводит ее из категории ‘Отрытого Исходного Кода’».

Источник: TheVerge