2
Поступила в редакцию 25.12.2017
Подписана в печать 01.02.2018
16 с.
PDF |
Д. Ю. Князьков
Обратная задача дифракции электромагнитной волны на плоском слое
В работе рассматривается обратная задача синтеза
функции пропускания плоского дифракционного слоя по формируемому им
при освещении электромагнитной волной изображению. Для решения
задачи применялся градиентный метод, что позволило достичь
необходимого качества изображения в плоскости регистрации.
Параллельный алгоритм метода градиентного спуска реализован в
программе, предназначенной для использования на суперкомпьютере
кластерного типа. Достигнуто практически линейное ускорение на
используемых вычислительных системах.
Ключевые слова: дифракция, обратные задачи,
градиентные методы оптимизации, высокопроизводительные вычисления. |
3
Поступила в редакцию 24.11.2017
Подписана в печать 01.02.2017
16 с.
PDF |
Н. И. Дикарев, Б. М. Шабанов, А. С. Шмелёв
Моделирование параллельной работы ядер векторного потокового
процессора с общей памятью
Процессор с архитектурой управления потоком данных
может выполнять до 16 команд в такт по сравнению с 4 – 6 командами в
такт у лучших процессоров фон-неймановской архитектуры.
Моделирование векторного потокового процессора показало, что его
производительность может быть доведена до 256 флоп в такт на ядро, и
при изготовлении на кристалле с современными технологическими
нормами можно разместить до 4 таких ядер. Приводятся результаты
моделирования системы из нескольких ядер векторного потокового
процессора с общей памятью на программах перемножения матриц и
решения систем дифференциальных уравнений 2D Stencil. Показано, что
программа перемножения матриц масштабируется пропорционально числу
ядер процессора, в то время как производительность 2D Stencil
ограничивается пропускной способностью к общей оперативной памяти.
Ключевые слова:
суперкомпьютер, векторный процессор, архитектура
управления потоком данных, оценка производительности, перемножение
матриц, 2D Stancil.
|