Новости по компании INTERNATIONAL BUSINESS MACHINES
Новость: положительная. Новые инновации процессоров IBM ускорят работу ИИ на мэйнфреймах IBM Z следующего поколения. Компания IBM (NYSE: IBM ) представила подробности архитектуры будущих процессоров IBM Telum® II и IBM Spyre™ Accelerator на выставке Hot Chips 2024. Новые технологии предназначены для значительного масштабирования вычислительной мощности в мэйнфреймах IBM Z следующего поколения, помогая ускорить использование традиционных моделей ИИ и моделей ИИ на больших языках в тандеме с помощью нового ансамблевого метода ИИ. Поскольку многие проекты генеративного ИИ, использующие большие языковые модели (LLM), переходят от этапа проверки концепции к производству, требования к энергоэффективным, защищенным и масштабируемым решениям стали ключевыми приоритетами. Исследование Morgan Stanley, опубликованное в августе, прогнозирует, что потребности генеративного ИИ в электроэнергии будут стремительно расти на 75% в год в течение следующих нескольких лет, что позволит ему потреблять столько же энергии в 2026 году, сколько Испания потребляла в 2022 году. 1 Многие клиенты IBM указывают, что архитектурные решения для поддержки базовых моделей соответствующего размера и гибридные подходы по проектированию для рабочих нагрузок ИИ становятся все более важными. Процессор IBM Telum II: Разработанный для систем IBM Z следующего поколения, новый чип IBM отличается повышенной частотой, емкостью памяти, 40-процентным ростом кэша и интегрированным ядром ускорителя ИИ, а также когерентно подключенным блоком обработки данных (DPU) по сравнению с чипом Telum первого поколения. Ожидается, что новый процессор будет поддерживать корпоративные вычислительные решения для LLM, обслуживая сложные транзакционные потребности отрасли. Ускоритель ввода-вывода: совершенно новый блок обработки данных (DPU) на чипе процессора Telum II разработан для ускорения сложных протоколов ввода-вывода для сетей и хранения на мэйнфрейме. DPU упрощает системные операции и может улучшить производительность ключевых компонентов. IBM Spyre Accelerator: обеспечивает дополнительные вычислительные возможности ИИ для дополнения процессора Telum II. Работая вместе, чипы Telum II и Spyre образуют масштабируемую архитектуру для поддержки ансамблевых методов моделирования ИИ — практики объединения нескольких моделей машинного обучения или глубокого обучения ИИ с LLM кодировщика. Используя сильные стороны архитектуры каждой модели, ансамблевый ИИ может обеспечивать более точные и надежные результаты по сравнению с отдельными моделями. Чип IBM Spyre Accelerator, представленный на конференции Hot Chips 2024, будет поставляться в качестве дополнительной опции. Каждый чип ускорителя подключается через адаптер PCIe мощностью 75 Вт и основан на технологии, разработанной в сотрудничестве с IBM Research. Как и другие карты PCIe, Spyre Accelerator масштабируется в соответствии с потребностями клиента. «Наша надежная многопоколенная дорожная карта позволяет нам оставаться впереди технологических тенденций, включая растущие требования к ИИ», — сказала Тина Тарквинио , вице-президент по управлению продуктами IBM Z и LinuxONE. «Процессор Telum II и ускоритель Spyre предназначены для предоставления высокопроизводительных, защищенных и более энергоэффективных корпоративных вычислительных решений. После многих лет разработки эти инновации будут представлены в нашей платформе IBM Z следующего поколения, чтобы клиенты могли использовать LLM и генеративный ИИ в масштабе». Процессор Telum II и ускоритель IBM Spyre будут производиться давним партнером IBM по производству, Samsung Foundry, и построены на его высокопроизводительном, энергоэффективном 5-нм технологическом узле. Работая вместе, они будут поддерживать ряд передовых вариантов использования ИИ, разработанных для раскрытия бизнес-ценности и создания новых конкурентных преимуществ. С помощью ансамблевых методов ИИ клиенты могут достигать более быстрых и точных результатов своих прогнозов. Объединенная вычислительная мощность, объявленная сегодня, обеспечит рампу для применения вариантов использования генеративного ИИ. Вот некоторые примеры: Обнаружение мошенничества в страховых претензиях: улучшенное обнаружение мошенничества в страховых претензиях на жилье с помощью ансамбля ИИ, который объединяет LLM с традиционными нейронными сетями, направленными на повышение производительности и точности. Расширенная борьба с отмыванием денег: расширенное обнаружение подозрительной финансовой деятельности, поддержка соблюдения нормативных требований и снижение риска финансовых преступлений. Помощники на основе искусственного интеллекта: ускорение жизненного цикла приложений, передача знаний и опыта, объяснение кода, а также его преобразование и многое другое. Технические характеристики и показатели производительности : Процессор Telum II : восемь высокопроизводительных ядер, работающих на частоте 5,5 ГГц, с кэшем L2 объемом 36 МБ на ядро и 40%-ным увеличением емкости кэша на чипе, что в общей сложности составляет 360 МБ. Виртуальный кэш уровня 4 объемом 2,88 ГБ на каждый блок процессора обеспечивает 40%-ное увеличение по сравнению с предыдущим поколением. Интегрированный ускоритель ИИ обеспечивает низкозадерживаемый, высокопроизводительный вывод ИИ в транзакциях, например, улучшая обнаружение мошенничества во время финансовых транзакций, и обеспечивает четырехкратное увеличение вычислительной мощности на чип по сравнению с предыдущим поколением. Новый блок ускорения ввода-вывода DPU интегрирован в чип Telum II. Он разработан для улучшения обработки данных с 50%-ным увеличением плотности ввода-вывода. Это усовершенствование повышает общую эффективность и масштабируемость IBM Z, делая его хорошо подходящим для обработки крупномасштабных рабочих нагрузок ИИ и ресурсоемких приложений современного бизнеса. Spyre Accelerator : демонстрируется специально созданный ускоритель корпоративного уровня, предлагающий масштабируемые возможности для сложных моделей ИИ и вариантов использования генеративного ИИ. Он оснащен памятью объемом до 1 ТБ, созданной для работы в тандеме на восьми картах обычного отсека ввода-вывода для поддержки рабочих нагрузок моделей ИИ на мэйнфрейме, при этом потребляя не более 75 Вт на карту. Каждый чип будет иметь 32 вычислительных ядра, поддерживающих типы данных int4, int8, fp8 и fp16 как для приложений ИИ с низкой задержкой, так и для высокопроизводительных приложений ИИ. Доступность: Процессор Telum II станет центральным процессором для платформ IBM Z и IBM LinuxONE следующего поколения от IBM. Ожидается, что он станет доступен клиентам IBM Z и LinuxONE в 2025 году. IBM Spyre Accelerator, который в настоящее время находится в стадии технической предварительной версии, также, как ожидается, будет доступен в 2025 году. Заявления относительно будущего направления и намерений IBM могут быть изменены или отозваны без предварительного уведомления и представляют собой исключительно цели и задачи. Источник: www.prnewswire.com
Пост взят с международного финтех-медиа ресурса
ДЛЯ ЛЮДЕЙ