Ускорители AMD Instinct MI300X обеспечивают поддержку рабочих нагрузок службы Microsoft Azure OpenAI и новых виртуальных машин Azure ND MI300X V5
Ускорители AMD Instinct MI300X обеспечивают поддержку рабочих нагрузок службы Microsoft Azure OpenAI и новых виртуальных машин Azure ND MI300X V5. Сегодня на выставке Microsoft Build компания AMD (NASDAQ: AMD) продемонстрировала свои новейшие комплексные вычислительные и программные возможности для клиентов и разработчиков Microsoft. Используя решения AMD, такие как ускорители AMD Instinct™ MI300X, открытое программное обеспечение ROCm™, процессоры и программное обеспечение Ryzen™ AI, а также медиа-ускорители Alveo™ MA35D, Microsoft может предоставить мощный набор инструментов для развертывания на основе искусственного интеллекта на многочисленных рынках. Новые виртуальные машины Microsoft Azure ND MI300X теперь общедоступны, предоставляя таким клиентам, как Hugging Face, доступ к впечатляющей производительности и эффективности для самых требовательных рабочих нагрузок искусственного интеллекта. «Программный стек AMD Instinct MI300X и ROCm используется в службах Azure OpenAI Chat GPT 3.5 и 4, которые являются одними из самых требовательных рабочих нагрузок искусственного интеллекта в мире», — сказал Виктор Пэн, президент AMD. «Благодаря общедоступности новых виртуальных машин Azure клиенты ИИ получают более широкий доступ к MI300X для предоставления высокопроизводительных и эффективных решений для приложений ИИ». «У Microsoft и AMD богатая история партнерства на различных вычислительных платформах: сначала ПК, затем специальные микросхемы для Xbox, HPC, а теперь и искусственный интеллект», — сказал Кевин Скотт, главный технический директор и исполнительный вице-президент подразделения искусственного интеллекта Microsoft. «В недавнем прошлом мы осознали важность сочетания мощного вычислительного оборудования с оптимизацией системы и программного обеспечения, необходимой для обеспечения потрясающей производительности и ценности искусственного интеллекта. Вместе с AMD мы добились этого, используя ROCm и MI300X, предоставив клиентам и разработчикам Microsoft AI возможность достичь отличных результатов по соотношению цена-качество для самых передовых и передовых моделей с интенсивными вычислениями. Мы стремимся к нашему сотрудничеству с AMD, чтобы продолжать продвигать прогресс в области искусственного интеллекта». Развитие искусственного интеллекта в Microsoft. Серия виртуальных машин Azure ND MI300x v5, о которой ранее было объявлено в предварительной версии в ноябре 2023 года, теперь доступна в Центральном регионе Канады, чтобы клиенты могли выполнять свои рабочие нагрузки искусственного интеллекта. Обладая лучшей в отрасли производительностью , эти виртуальные машины обеспечивают впечатляющую емкость HBM и пропускную способность памяти, что позволяет клиентам размещать более крупные модели в памяти графического процессора и/или использовать меньше графических процессоров, что в конечном итоге помогает сэкономить электроэнергию, затраты и время на поиск решения. Эти виртуальные машины и программное обеспечение ROCm™, которое их поддерживает, также используются для рабочих нагрузок Azure AI Production, включая службу Azure OpenAI, предоставляющую клиентам доступ к моделям GPT-3.5 и GPT-4. Благодаря AMD Instinct MI300X и проверенному и готовому открытому программному стеку ROCm Microsoft может достичь наилучшего соотношения цены и производительности при рабочих нагрузках вывода GPT. Помимо производственных рабочих нагрузок искусственного интеллекта Azure, одним из первых клиентов, использующих эти виртуальные машины, является Hugging Face. Перенеся свои модели на виртуальные машины ND MI300X всего за один месяц, компания Hugging Face смогла добиться впечатляющей производительности по соотношению цена/производительность для своих моделей. В рамках этого клиенты виртуальных машин ND MI300X могут переносить модели Hugging Face на виртуальные машины для простого и эффективного создания и развертывания приложений NLP. «Тесное сотрудничество между Microsoft, AMD и Hugging Face в экосистеме открытого программного обеспечения ROCm позволит пользователям Hugging Face запускать сотни тысяч моделей искусственного интеллекта, доступных в Hugging Face Hub в Azure, с графическими процессорами AMD Instinct без изменения кода, что упростит работу Клиенты Azure должны создавать искусственный интеллект с использованием открытых моделей и открытого исходного кода», — сказал Жюльен Саймон, главный евангелист Hugging Face. Кроме того, разработчики могут использовать программное обеспечение AMD Ryzen AI для оптимизации и развертывания выводов искусственного интеллекта на AMD Райзен ИИ ПК с питанием. Программное обеспечение Ryzen AI позволяет приложениям запускаться на нейронном процессоре (NPU), построенном наAMD XDNA™ архитектура, первая специализированная микросхема для обработки искусственного интеллекта на процессоре Windows x86 2 . Хотя запуск моделей ИИ только на ЦП или графическом процессоре может быстро разряжать батарею, на ноутбуке с процессором Ryzen модели ИИ работают на встроенном NPU, высвобождая ресурсы ЦП и графического процессора для других вычислительных задач. Это помогает значительно увеличить срок службы батареи и позволяет разработчикам эффективно и локально запускать рабочие нагрузки LLM AI и параллельные приложения на устройстве. Развитие видеосервисов и корпоративных вычислений. Microsoft выбралаМедиа-ускоритель AMD Alveo™ MA35Dдля поддержки своих обширных рабочих нагрузок потокового видео в реальном времени, включая Microsoft Teams, видео SharePoint и другие. Alveo MA35D, специально созданный для поддержки интерактивных потоковых сервисов в реальном времени, поможет Microsoft обеспечить высококачественное видео за счет оптимизации рабочих нагрузок по обработке видео, включая транскодирование, декодирование, кодирование и потоковую передачу с адаптивным битрейтом (ABR). Используя ускоритель Alveo MA35D в серверах на базе процессоров AMD EPYC™ четвертого поколения, Microsoft получает: Возможность консолидации серверов и облачной инфраструктуры . Используя высокую плотность каналов, энергоэффективность и возможности обработки видео со сверхнизкой задержкой Alveo MA35D, Microsoft может значительно сократить количество серверов, необходимых для поддержки больших объемов интерактивных потоковых приложений в реальном времени. Впечатляющая производительность — Alveo MA35D оснащен блоками обработки видео на базе ASIC, поддерживающими стандарт сжатия AV1 и оптимизацию качества видео с поддержкой AI, которые помогают обеспечить плавное и плавное воспроизведение видео. Готовая к будущему технология AV1 — Alveo MA35D с возможностью обновления для поддержки новых стандартов, таких как AV1, предоставляет Microsoft решение, которое может адаптироваться к меняющимся требованиям к обработке видео. Источник: www.globenewswire.com
Пост взят с международного финтех-медиа ресурса
ДЛЯ ЛЮДЕЙ