Программное и аппаратное обеспечение распределенных и суперкомпьютерных систем
Обзорная статья
004.051+004.272+004.318+004.382+004.8+004.9ББК
32.971.32-04ГРНТИ
50.09.33DOI
Вокруг условного 4-го поколения современных серверных процессоров AMD и Intel: их микроархитектура и производительность соответствующих вычислительных систем
Михаил Борисович Кузьминский
| Институт органической химии им. Н. Д. Зелинского РАН, Москва, Россия | |
|
|
Аннотация. Обзор посвящен особенностям микроархитектуры и производительности процессоров Intel Xeon — масштабируемых процессоров 4-го поколения (c микроархитектурой Sapphire Rapids-SP, далее Xeon SPR), 5-го поколения (Emerald Rapids-SP, далее Xeon EMR), и разных классов процессоров AMD EPYC архитектуры Zen 4, а также вычислительным системам на их основе. Анализируются данные о моделях Xeon SPR (и Xeon SPR с памятью HBM, то есть Xeon Max), Xeon EMR и процессорax AMD EPYC 9004 (хотя приведены и краткие данные о EPYC 8004 и 4004).
Эти процессоры отнесены в обзоре к условному 4-му поколению Xeon и EPYC. Сопоставления проводятся и с масштабируемыми процессорами Xeon 3-го поколения — Ice Lake-SP (далее Xeon ICL), Cooper Lake-SP, с AMD EPYC с архитектурой Zen 3 (Milan), а также иногда с процессорами ARM-архитектуры и GPU.
Кратко обсуждаются средства разработки программ (SDK) для процессоров 4-го поколения, имеющие важное значение для достигаемой производительности. В связи с применением чиплетов или использованием HBM-памяти в рассматриваемых процессорах AMD и Intel особое внимание обращается на поддерживаемые варианты NUMA.
Анализируется также аппаратная поддержка средств обеспечения безопасности для задач виртуализации, которые теперь часто применяются и в области высокопроизводительных вычислений (HPC).
Данные о производительности в обзоре охватывают широкий спектр областей применения, характерных для серверов с этими процессорами. Но основное внимание уделяется HPC и, в меньшей степени, задачам ИИ.
Рассматриваемые процессоры анализируются с точки зрения построения с ними гомогенных или содержащих GPU гетерогенных серверов и вычислительных систем на их основе (кластеров и суперкомпьютеров).
Анализируется также начальная информация о новейших процессорах Intel Xeon 6 Granite Rapids и AMD EPYC Zen 5 Turin, включая первые данные об их производительности.
Сделаны выводы общего характера о состоянии и образовавшихся тенденциях развития таких процессоров x86. (Связанные тексты статьи на английском и на русском языках).
Ключевые слова: x86, Zen 4, Genoa, Bergamo, Zen 5,Turin, Sapphire Rapids, Xeon Max, Emerald Rapids, Xeon 6, Granite Rapids, микроархитектура, производительность, HPC, ИИ, суперкомпьютеры
Для цитирования: Кузьминский М. Б. Вокруг условного 4-го поколения современных серверных процессоров AMD и Intel: их микроархитектура и производительность соответствующих вычислительных систем // Программные системы: теория и приложения. 2025. Т. 16. № 5. С. 43–514. (Англ., Рус.). https://psta.psiras.ru/2025/5_43-514.
Полный текст двуязычной статьи (PDF): https://psta.psiras.ru/read/psta2025_5_43-514.pdf (клик по флажку в верхнем колонитуле переключит язык страницы).
Русскоязычная часть оригинальной двуязычной статьи (PDF): https://psta.psiras.ru/read/psta2025_5_43-514-ru.pdf.
Статья поступила в редакцию 31.05.2025; одобрена после рецензирования 14.10.2023; принята к публикации 10.11.2025; опубликована онлайн 15.01.2026.