|
|
• Содержание выпуска • • Математические основы программирования • • Программное и аппаратное обеспечение распределенных и суперкомпьютерных систем • • Искусственный интеллект, интеллектуальные системы, нейронные сети •
Программное и аппаратное обеспечение распределенных и суперкомпьютерных
систем
Ответственный за рубрику: д.ф.-м.н., чл.-корр. РАН Абрамов С.М.
Слева для каждой статьи показаны: присвоенный статье порядковый номер;
дата поступления статьи в
редакцию; количество страниц статьи в
формате А5; ссылка на полный текст статьи в формате PDF
.
3
Поступила в редакцию 17.12.2021
Подписана в печать 22.02.2022
67 с.
PDF |
М. Б. Кузьминский
Современные серверные ARM-процессоры для
суперЭВM: A64FX и другие
Начальные данные тестов производительности
Дан сравнительный анализ производительности серверных
ARM-процессоров, используемых на суперЭВМ или ориентированных
в частности на высокопроизводительные
вычисления (HPC). В стартовый анализ производительности были
отобраны Fujitsu A64FX, Marvell ThunderX2 и
Huawei Kunpeng 920. Обзор производительности для HPC
сосредоточен в первую очередь на тестах и приложениях для
A64FX, поддерживающего более длинные, чем у
других ARM-процессоров, вектора и имеющего
большую пиковую производительность. Производительность
A64FX сопоставлена с соответствующими данными для Intel Xeon
Skylake и Cascade Lake, и AMD EPYC с Zen 2 и
3 (Roma и Milan), а также с GPU Nvidia V100 и
A100. Сформулирован краткий набор потенциальных плюсов
и минусов микроархитектуры A64FX. Сопоставлены данные о
производительности, получаемой с применением различных компиляторов
для A64FX. Сформированы признаки, когда A64FX
дает обычно преимущества в производительности
относительно x86-64, а когда — проигрывает x86-64.
Подтверждается, что применение A64FX в суперЭВМ может расти
далее. Возможно, гегемония x86-64 в HPC будет уменьшаться, в
том числе за счет расширения применения
серверных ARM-процессоров. Однако проведенный
анализ A64FX и ожидаемых в ближайшее время новых
процессоров архитектуры AArch64 показал, что ведущим в этом
процессе не обязательно окажется A64FX.
Ключевые слова:
ARM, AArch64, A64FX, x86-64, высокопроизводительные
вычисления, суперЭВМ, тесты производительности. |
Ссылка на статью обязательна |
http://psta.psiras.ru/read/psta2022_1_63-129.pdf |
цифровой идентификатор
статьи DOI |
https://doi.org/10.25209/2079-3316-2022-13-1-63-129 |
4
Поступила в редакцию 17.12.2021
Подписана в печать 22.02.2022
64 с.
PDF |
М. Б. Кузьминский
Современные серверные ARM-процессоры для
суперЭВM: A64FX и другие
Начальные данные тестов производительности
Дан сравнительный анализ производительности серверных
ARM-процессоров, используемых на суперЭВМ или ориентированных
в частности на высокопроизводительные
вычисления (HPC). В стартовый анализ производительности были
отобраны Fujitsu A64FX, Marvell ThunderX2 и
Huawei Kunpeng 920. Обзор производительности для HPC
сосредоточен в первую очередь на тестах и приложениях для
A64FX, поддерживающего более длинные, чем у
других ARM-процессоров, вектора и имеющего
большую пиковую производительность. Производительность
A64FX сопоставлена с соответствующими данными для Intel Xeon
Skylake и Cascade Lake, и AMD EPYC с Zen 2 и
3 (Roma и Milan), а также с GPU Nvidia V100 и
A100. Сформулирован краткий набор потенциальных плюсов
и минусов микроархитектуры A64FX. Сопоставлены данные о
производительности, получаемой с применением различных компиляторов
для A64FX. Сформированы признаки, когда A64FX
дает обычно преимущества в производительности
относительно x86-64, а когда — проигрывает x86-64.
Подтверждается, что применение A64FX в суперЭВМ может расти
далее. Возможно, гегемония x86-64 в HPC будет уменьшаться, в
том числе за счет расширения применения
серверных ARM-процессоров. Однако проведенный
анализ A64FX и ожидаемых в ближайшее время новых
процессоров архитектуры AArch64 показал, что ведущим в этом
процессе не обязательно окажется A64FX.
(англ.)
Ключевые слова:
ARM, AArch64, A64FX, x86-64, высокопроизводительные
вычисления, суперЭВМ, тесты производительности. |
Ссылка на статью обязательна |
http://psta.psiras.ru/read/psta2022_1_131-194.pdf |
цифровой идентификатор
статьи DOI |
https://doi.org/10.25209/2079-3316-2022-13-1-131-194 |
• Содержание выпуска • • Математические основы программирования • • Программное и аппаратное обеспечение распределенных и суперкомпьютерных систем • • Искусственный интеллект, интеллектуальные системы, нейронные сети •
|