G
enby!

Новый GPU NVIDIA Rubin и софт Dynamo: Инновации в AI инфраструктуре

В этом ключевом выступлении NVIDIA на AI Infra Summit 2025 Иэн Бак, вице-президент по гипермасштабируемым и высокопроизводительным вычислениям, рассказывает о самых передовых методах построения AI инфраструктуры. Подробно рассматривается сложность инференса — от выбора размера модели и скорости отклика до стоимости и энергоэффективности, с акцентом на оптимизацию на всех уровнях. Основные темы видео: Проблемы и возможности AI инференса Аппаратные инновации: новый GPU Rubin и стойка Vera Rubin Программные решения: Dynamo и масштабируемый инференс Управление миллионами токенов и будущее AI ЦОД Практические примеры: AI для программирования и генерации видео Это видео будет полезно всем, кто интересуется становлением следующей эры AI — от исследователей до инженеров и лидеров индустрии. Подписывайтесь, ставьте лайки и делитесь своими мыслями в комментариях! 00:00 — Введение 10:41 — Тестирование и производительность NVIDIA 11:38 — Оптимизация программного обеспечения 12:35 — Экономическая эффективность 13:30 — Инференс и его фазы 16:13 — Программное обеспечение NVIDIA Dynamo 17:09 — Пример использования 21:49 — Новый графический процессор Rubin 22:48 — Интеграция в стойку Vera Rubin 23:48 — Ресурсы и архитектура стойки 24:43 — Увеличение производительности с Cpx 25:38 — Новая стойка VR CPS 26:35 — Партнёры и применение 30:24 — Партнёры и перспективы 27:38 — Дорожная карта чипов 29:07 — Будущее центров обработки данных Telegram https://t.me/SwarowskyTech
Boosty https://boosty.to/swarowskytech
Rutube https://rutube.ru/channel/44646817
Dzen https://dzen.ru/swarowskytech
VK play https://vk.com/video/@club227441425
По вопросам авторских прав обращайтесь For copyright issues, please contact technoblog2021@gmail.com

Смотрите также