После всплеска популярности DeepSeek Nvidia прокомментировала нового игрока в области искусственного интеллекта
- Nvidia называет DeepSeek «отличным шагом вперед в развитии ИИ»
- Nvidia указывает на важность своих графических процессоров
Если вы еще не слышали о DeepSeek, недавно этот проект стал настоящей сенсацией. Он предложил реальную альтернативу ChatGPT по значительно более низкой цене, что вызвало бурю на фондовом рынке и привело к падению цен на акции технологических компаний. Nvidia, в частности, столкнулась с рекордным падением акций на сумму 600 миллиардов долларов.
DeepSeek, разработанный одноименным китайским стартапом, представляет собой бесплатный ИИ-чатбот, соперничающий с ChatGPT от OpenAI. Новый продукт произвел фурор в мире искусственного интеллекта и занял первое место в Apple App Store в США и Великобритании.
Популярность приложения и сайта привела к временному отключению и якобы злонамеренной атаке в тот же день, когда DeepSeek достиг своей пика известности.
В то время как генеральный директор OpenAI Сэм Альтман назвал DeepSeek впечатляющим, Nvidia, глобальный лидер в области чипов для ИИ, также высказалась. В заявлении для TechRadar Nvidia отметила, что DeepSeek — это «отличный шаг вперед в развитии ИИ», демонстрирующий, как новые модели могут быть созданы с использованием широко доступных моделей и вычислений. Это требует большого количества графических процессоров Nvidia и высокопроизводительных сетей, подчеркивая, что эти технологии остаются важной частью развертывания таких моделей.
Nvidia утверждает, что для проведения инференса требуется значительное количество графических процессоров и указывает, что DeepSeek использовал специфические для Китая графические процессоры от Nvidia. Компания намекает, что в будущем DeepSeek может потребоваться еще больше таких чипов.
DeepSeek разработал свои модели, используя новый процесс обучения с использованием метода проб и ошибок для самоулучшения. Такой подход позволяет моделям учиться, как это делают люди, получая обратную связь на основе своих действий, и использует архитектуру MoE (Mixture-of-Experts), позволяющую активировать только часть параметров в любой момент времени. Это снижает вычислительные затраты и делает систему более эффективной.
Сам Альтман также высоко оценил усилия DeepSeek, особенно за их способность предлагать конкурентоспособные цены. Он подчеркнул, что OpenAI представит более продвинутые модели, однако приветствовал конкуренцию.
DeepSeek пока приостановил новые регистрации, и остается только ждать, когда платформа вернет свою полную функциональность.
Источник: TechRadar