Триллиум достиг общей доступности спустя всего несколько месяцев после предварительного выпуска
- Мощный чип AI предлагает более чем четырехкратное увеличение производительности обучения.
- Google использует его для обучения Gemini 2.0, продвинутой AI модели компании.
Google занимается разработкой пользовательских ускорителей искусственного интеллекта — Tensor Processing Units (TPU) — уже более десятилетия. Спустя несколько месяцев после предварительного выпуска компания объявила, что ее TPU шестого поколения достигла общей доступности и теперь доступна для аренды.
Триллиум удвоил и объем памяти HBM, и пропускную способность межчипового соединения. Он был использован для обучения Gemini 2.0, флагманской AI модели технологического гиганта.
Google сообщает, что Trillium предлагает улучшение производительности обучения до 2,5 раз на доллар по сравнению с предыдущими поколениями TPU, что делает его привлекательным вариантом для предприятий, ищущих эффективную инфраструктуру AI.
AI Гиперкомпьютер Google Cloud
Триллиум обеспечивает множество улучшений по сравнению со своим предшественником, включая более чем четырехкратное увеличение производительности обучения. Энергоэффективность увеличена на 67%, а пиковая вычислительная мощность на чип возросла в 4,7 раза.
Триллиум естественным образом улучшает также и производительность вывода. Тесты Google показывают более чем трехкратное увеличение пропускной способности для моделей генерации изображений, таких как Stable Diffusion XL, и почти вдвое большую пропускную способность для крупных языковых моделей по сравнению с предыдущими поколениями TPU.
Чип также оптимизирован для моделей, интенсивно использующих вложения, с его третьим поколением SparseCore, обеспечивающим лучшую производительность для динамических и операндозависимых операций.
Триллиум TPU станет основой AI Гиперкомпьютера Google Cloud. Эта система включает более 100 000 чипов Trillium, соединенных через сеть Jupiter, обеспечивающую 13 петабит/сек пропускной способности. Она интегрирует оптимизированное оборудование, открытое программное обеспечение и популярные фреймворки машинного обучения, включая JAX, PyTorch и TensorFlow.
С доступностью Trillium, клиенты Google Cloud получают возможность использовать то же оборудование, которое использовалось для обучения Gemini 2.0, тем самым повышая доступность высокопроизводительной AI-инфраструктуры для широкого круга приложений.
Источник: TechRadar
Добавить комментарий
Ваш адрес email не будет опубликован.