DeepSeek R1 теперь доступен на платформах Nvidia, AWS и Github

03.02.2025

Nvidia интегрирует DeepSeek-R1 как NIM микросервис

AWS поддерживает DeepSeek-R1 с акцентом на масштабируемое и экономически эффективное развертывание ИИ

Microsoft также планирует локальное развертывание DeepSeek в будущем

В последнее время DeepSeek сделал значительный шаг вперед в расширении доступности своих моделей продвинутого анализа и обоснования в мире искусственного интеллекта.

Теперь флагманская модель компании, DeepSeek R1, представлена на нескольких платформах, включая Nvidia, AWS и GitHub.

Благодаря своей открытости, разработчики могут создавать модели на базе архитектуры DeepSeek. В настоящее время на платформе сотрудничества в области разработки AI моделей Hugging Face доступны 3,374 модели, основанные на DeepSeek.

Nvidia, AWS, Github и Azure теперь предлагают DeepSeek

На AWS модели DeepSeek-R1 стали доступны через Amazon Bedrock, что упрощает интеграцию API, и Amazon SageMaker, который предлагает продвинутую настройку и обучение. Поддержка AWS Trainium и Inferentia обеспечивает оптимизацию затрат.

AWS также предлагает облегченную версию DeepSeek-R1-Distill через Amazon Bedrock Custom Model Import. Это серверлесс-развертывание упрощает управление инфраструктурой, сохраняя при этом масштабируемость.

Nvidia интегрировала DeepSeek-R1 как NIM микросервис, используя архитектуру Hopper и ускорение FP8 Transformer Engine для обеспечения высококачественных ответов в реальном времени.

Модель, обладающая 671 миллиардами параметров и контекстной длиной в 128,000 токенов, использует масштабирование во время тестов для повышения точности. На системе HGX H200 DeepSeek-R1 способен выдавать до 3,872 токенов в секунду.

Microsoft и GitHub также расширяют охват DeepSeek, предлагая разработчикам безопасную и масштабируемую платформу для интеграции ИИ в их рабочие процессы. Microsoft внедрила обширные меры безопасности, включая фильтрацию контента и автоматизированные оценки. Компания планирует предлагать упрощенные версии DeepSeek-R1 для локального развертывания на Copilot+ ПК.

Модель DeepSeek-R1 произвела фурор, предложив мощную и экономически выгодную ИИ-модель с продвинутыми возможностями анализа, потеснив популярные модели, такие как ChatGPT.

DeepSeek-R1 была обучена всего за $6 миллионов, а ее самые продвинутые версии на 95% дешевле в обучении по сравнению с аналогами от NVIDIA и Microsoft.

Источник: TechRadar