banner
Дом / Блог / Подробности об Intel 144
Блог

Подробности об Intel 144

Apr 06, 2024Apr 06, 2024

Intel продемонстрирует архитектуры P- и E-Core на выставке Hot Chips 2023.

На выставке Hot Chips 2023 компания Intel представила первые подробные сведения о своих будущих 144-ядерных процессорах Xeon Sierra Forest и Granite Rapids, причем первый будет состоять из новых ядер Intel Sierra Glen E-core, а второй — новых P-ядер Redwood Cove. . Предстоящие чипы Xeon следующего поколения будут выпущены в первой половине следующего года с новой тайловой архитектурой, которая включает в себя два чиплета ввода-вывода на базе технологии Intel 7 в сочетании с различными конфигурациями вычислительных ядер, выгравированных на Intel 3. процесс. Такая конструкция позволяет Intel создавать несколько продуктов на основе разных типов ядер, сохраняя при этом одну и ту же базовую конфигурацию. . Они также совместимы с одними и теми же программными стеками, что позволяет клиентам использовать любой чип в зависимости от их потребностей. Intel утверждает, что конструкция нового поколения Xeon Sierra Forest на базе E-Core обеспечит до 2,5 раз большую плотность размещения в стойке и в 2,4 раза выше. производительность на ватт, чем у чипов Xeon четвертого поколения, в то время как процессоры Granite Rapids на базе P-Core обеспечат в 2–3 раза большую производительность в смешанных рабочих нагрузках искусственного интеллекта, что частично связано с улучшением пропускной способности памяти «до» в 2,8 раза. Давайте погрузимся.

Первоначально Intel перешла на тайловую архитектуру (по типу чиплета) с процессорами Xeon Sapphire Rapids четвертого поколения, но Sierra Forest и Granite Rapids привнесли в этот подход новый уровень дезагрегации. В процессорах Sapphire Rapids Intel использовала четырехкристальную конструкцию. , где каждый кристалл содержит часть соответствующих функций ввода-вывода, таких как контроллеры памяти и PCIe. В новых процессорах некоторые функции ввода-вывода полностью распределены по двум отдельным микросхемам HSIO, выполненным по технологии Intel 7, что обеспечивает наилучший баланс стоимости, мощности и производительности для ввода-вывода, в то время как ядра ЦП и контроллеры памяти располагаются отдельно. выделенные вычислительные чиплеты.

Два кристалла HSIO расположены сверху и снизу корпуса микросхемы, от одного до трех вычислительных кристаллов расположены в центре, все они связаны вместе с помощью неопределенного количества межсоединений EMIB (встроенный многокристальный межкомпонентный мост), сплавленных внутри подложки и подключенных к межсоединение кристалла к кристаллу на каждом конце моста. В вычислительных ячейках будут использоваться либо P-ядра Redwood Cove (производительные ядра) для Granite Rapids, либо E-ядра Sierra Glen для Sierra Forest — Intel не будет предоставлять модели с обоими типами. ядер в одном корпусе. Вычислительные чиплеты оснащены процессом Intel 3 с поддержкой EUV, который включает в себя библиотеки высокой плотности, которые не были включены в процесс Intel 4. Первоначально Intel отложила выпуск Granite Rapids Xeon с 2023 на 2024 год из-за смены дизайна с «Intel 4» на «Intel 3», но выпуск чипов остается в рамках графика в первой половине 2024 года. Granite Rapids — это то, что мы воспринимаем как традиционный процессор для центров обработки данных Xeon — эти модели оснащены только P-ядрами, которые могут обеспечить полную производительность самых быстрых архитектур Intel. Каждое P-ядро имеет 2 МБ кэш-памяти L2 и 4 МБ кэш-памяти L3. Intel еще не раскрыла количество ядер для Granite Rapids, но сообщила, что платформа поддерживает от одного до восьми сокетов в одном сервере. Между тем, линейка E-core (эффективных ядер) Sierra Forest состоит из чипов только с ядрами меньшей эффективности, то же самое мы видим с чипами Intel Alder и Raptor Lake, что дает им хорошие возможности конкурировать с процессорами Arm, которые становятся все более распространенными в центрах обработки данных. Ядра E объединены в кластеры с двумя или четырьмя ядрами, которые совместно используют срез кэша L2 объемом 4 МБ и кэш L3 объемом 3 МБ. Процессоры, оснащенные E-Core, имеют до 144 ядер и оптимизированы для обеспечения максимальной энергоэффективности, эффективности использования площади и плотности производительности. В моделях с большим количеством ядер каждый вычислительный чипсет E-core имеет 48 ядер. Sierra Forest может устанавливаться в одно- и двухпроцессорные системы и имеет TDP всего лишь 200 Вт. Независимо от типа ядра, каждый вычислительный кристалл содержит ядра, кэш L2 и L3, а также структуру и домашний агент кэширования (CHA). . Они также размещают контроллеры памяти DDR5-6400 на каждом конце кристалла, всего до 12 каналов (1DPC или 2DPC) либо стандартной памяти DDR, либо новой памяти MCR, которая обеспечивает на 30-40% большую пропускную способность памяти, чем стандартные модули DIMM. Как вы можете видеть выше, вычислительные чиплеты будут иметь разные размеры в зависимости от модели, а продукты с одним вычислительным кристаллом будут поставляться с более крупным вычислительным кластером. Intel также будет варьировать количество каналов памяти на один вычислительный чиплет — здесь мы видим три контроллера памяти в продукте с одним вычислительным чиплетом, в то время как модели с двумя или более вычислительными чиплетами имеют по два контроллера памяти каждый. Решение Intel тесно интегрировать свои контроллеры памяти в вычислительный чиплет должно привести к более высокой производительности памяти при некоторых рабочих нагрузках по сравнению с разработками AMD EPYC, в которых все контроллеры памяти используются на одном центральном кристалле ввода-вывода, что увеличивает задержку и создает спорные моменты. Вычислительные кристаллы делят свой кэш L3 со всеми остальными ядрами в том, что Intel называет «логически монолитной сеткой», но их также можно разделить на кластеры суб-NUMA для оптимизации задержки для определенных рабочих нагрузок. Сетка объединяет фрагменты кэша L3 в единый общий кэш, общий объем которого может превышать полгигабайта — почти в 5 раз больше, чем у Sapphire Rapids. Каждая граница кристалла поддерживает пропускную способность между кристаллами более ТБ/с. В совокупности два кристалла HSIO поддерживают до 136 линий PCIe 5.0/CXL 2.0 (устройства типа 1, 2 и 3), до 6 каналов UPI (144 полос), а также ускорители сжатия, криптографии и потоковой передачи данных аналогично механизмам ускорения Sapphire Rapids. Каждый кристалл HSIO также включает в себя схему управления питанием, которая управляет вычислительными чипсетами, хотя каждый вычислительный чиплет также имеет собственный регулятор мощности, который при необходимости может работать независимо. Теперь Intel отказалась от требования к набору микросхем (PCH), что позволяет процессорам самостоятельно загружаться, подобно процессорам AMD EPYC.