Nvidia интегрирует DeepSeek-R1 как NIM микросервис
AWS поддерживает DeepSeek-R1 с акцентом на масштабируемое и экономически эффективное развертывание ИИ
Microsoft также планирует локальное развертывание DeepSeek в будущем
В последнее время DeepSeek сделал значительный шаг вперед в расширении доступности своих моделей продвинутого анализа и обоснования в мире искусственного интеллекта.
Теперь флагманская модель компании, DeepSeek R1, представлена на нескольких платформах, включая Nvidia, AWS и GitHub.
Благодаря своей открытости, разработчики могут создавать модели на базе архитектуры DeepSeek. В настоящее время на платформе сотрудничества в области разработки AI моделей Hugging Face доступны 3,374 модели, основанные на DeepSeek.
Nvidia, AWS, Github и Azure теперь предлагают DeepSeek
На AWS модели DeepSeek-R1 стали доступны через Amazon Bedrock, что упрощает интеграцию API, и Amazon SageMaker, который предлагает продвинутую настройку и обучение. Поддержка AWS Trainium и Inferentia обеспечивает оптимизацию затрат.
AWS также предлагает облегченную версию DeepSeek-R1-Distill через Amazon Bedrock Custom Model Import. Это серверлесс-развертывание упрощает управление инфраструктурой, сохраняя при этом масштабируемость.
Nvidia интегрировала DeepSeek-R1 как NIM микросервис, используя архитектуру Hopper и ускорение FP8 Transformer Engine для обеспечения высококачественных ответов в реальном времени.
Модель, обладающая 671 миллиардами параметров и контекстной длиной в 128,000 токенов, использует масштабирование во время тестов для повышения точности. На системе HGX H200 DeepSeek-R1 способен выдавать до 3,872 токенов в секунду.
Microsoft и GitHub также расширяют охват DeepSeek, предлагая разработчикам безопасную и масштабируемую платформу для интеграции ИИ в их рабочие процессы. Microsoft внедрила обширные меры безопасности, включая фильтрацию контента и автоматизированные оценки. Компания планирует предлагать упрощенные версии DeepSeek-R1 для локального развертывания на Copilot+ ПК.
Модель DeepSeek-R1 произвела фурор, предложив мощную и экономически выгодную ИИ-модель с продвинутыми возможностями анализа, потеснив популярные модели, такие как ChatGPT.
DeepSeek-R1 была обучена всего за $6 миллионов, а ее самые продвинутые версии на 95% дешевле в обучении по сравнению с аналогами от NVIDIA и Microsoft.
Источник: TechRadar