2
Поступила в редакцию 28.12.2016
Подписана в печать 23.01.2017
16 с.
PDF |
Д. Ю. Князьков
Эффективный расчет двумерного БПФ на однородном или гетерогенном
вычислительном кластере
Рассмотрена задача осуществления двумерного БПФ матрицы на
суперкомпьютере. Исследована зависимость времени выполнения БПФ от
размера матрицы для суперкомпьютеров МВС-100К, МВС-10П и HybriLIT.
Описан метод балансировки вычислительной нагрузки между вычислениями
на процессоре и видеокарте при использовании гетерогенного кластера.
На примере видеокарты TESLA K40 показано, что время, необходимое для
перемещения данных, близко времени, требуемому для осуществления
двумерного БПФ на графическом вычислителе, а само время расчета в 48
раз меньше времени счета на двухпроцессорном узле.
Ключевые слова:
HPC-вычисления, суперкомпьютерные вычисления, быстрое
преобразование Фурье, вычисления на графических процессорах. |
Ссылка на статью обязательна |
http://psta.psiras.ru/read/psta2017_1_47-62.pdf |
цифровой идентификатор
статьи DOI |
https://doi.org/10.25209/2079-3316-2017-8-1-47-62 |
4
Поступила в редакцию 24.12.2016
Подписана в печать 23.01.2017
21 с.
PDF |
Е. А. Барковский, Р. И. Кучумов, А. В. Соколов
Оптимальное управление двумя work-stealing деками в общей памяти
при различных стратегиях перехвата работы
В параллельных балансировщиках задач, работающих по стратегии
work-stealing, каждый процессор имеет свой дек (deque) задач. Один
конец дека используется только владельцем для добавления и
извлечения задач, а другой — для перехвата другими процессорами.
Целью работы является построение и анализ математических моделей
процесса работы с двумя циклическими деками, расположенными в общей
памяти. Параметрами этих моделей являются вероятности операций на
каждом шаге дискретного времени (возможно как последовательное, так
и параллельное выполнение операций). Модели строятся в виде
случайных блужданий по целочисленной решетке на плоскости. На основе
вышеупомянутых моделей решены задачи оптимального разделения памяти
при некоторых стратегиях перехвата элементов. В качестве критерия
оптимальности рассматривается максимальное среднее время до
переполнения памяти.
Проведены статистические исследования по оценке вероятностей
операций работы с деками для нескольких типов задач, выполняемых в
реализованном балансировщике. Для полученных вероятностей операций
работы с деками проведены численные эксперименты по анализу
разработанных моделей.
Ключевые слова:
work-stealing балансировщики, work-stealing деки,
структуры данных, цепи Маркова, случайные блуждания. |
Ссылка на статью обязательна |
http://psta.psiras.ru/read/psta2017_1_83-103.pdf |
цифровой идентификатор
статьи DOI |
https://doi.org/10.25209/2079-3316-2017-8-1-83-103 |
5
Поступила в редакцию 28.12.2016
Подписана в печать 13.03.2017
15 с.
PDF |
В. В. Волошинов, С. А. Смирнов
Оценка производительности крупноблочного алгоритма метода ветвей
и границ в вычислительной среде Everest
В работе исследовался т.н. крупноблочный подход к реализации
параллельной работы метода ветвей и границ (МВГ). Исходная задача
частично-целочисленного программирования разбивается на несколько
подзадач посредством фиксации значений у части целочисленных
переменных. Подзадачи решаются параллельно пулом МВГ-решателей. Если
в ходе решения подзадач появляется допустимое решение, с наилучшим
на данный момент значением целевой функции, то это число рассылается
другим решателям. Такой обмен рекордными значениями критерия
позволяет взаимно ускорить решение подзадач за счет сокращения
перебора вершин дерева ветвлений алгоритма МВГ. Запуск подзадач и
обмен данными обеспечивается средствами платформы Everest. В
результате тестирования разработанной распределенный системы на
случайным образом сгенерированных задачах линейного программирования
с частично-булевыми переменными было обнаружено заметное ускорение.
Ключевые слова: дискретная оптимизация, метод ветвей
и границ, крупнозернистый параллелизм. |
Ссылка на статью обязательна |
http://psta.psiras.ru/read/psta2017_1_105-119.pdf |
цифровой идентификатор
статьи DOI |
https://doi.org/10.25209/2079-3316-2017-8-1-105-119 |
7
Поступила в редакцию 22.12.2016
Подписана в печать 13.03.2017
15 с.
PDF |
А. А. Кондратьев, А. Ю. Беззубцев, А. В. Смирнов
Применение распределенной системы обработки данных в задаче
построения автоматизированной системы видеонаблюдения
Современные подходы к построению систем
видеонаблюдения начинают все больше ориентироваться на автоматизацию.
Статья описывает подход к построению автоматизированной системы
видеонаблюдения на основе сенсоров, построенных с использованием
микрокомпьютеров, и высокопроизводительного кластерного вычислителя,
с помощью системы распределенной блочно-параллельной обработки
данных. Описываемый подход основывается на возможности использования
универсальных компонентов за счет применения микрокомпьютеров и
оперативного расширения возможностей комплекса за счет применения
программной системы обработки данных с модульным подходом. В отличие
от других автоматизированных систем обеспечивается возможность
доработки алгоритмов обработки и передачи данных.
Блочно-параллельный подход организации алгоритмов обработки
позволяет организовать масштабирование комплекса. В заключение
представлены результаты экспериментальных исследований, а также
основные выводы, положительные и отрицательные стороны подхода и
разработанного комплекса.
Ключевые слова: распределенная системы,
высокопроизводительного кластерного вычислителя, сенсорно
вычислительный узел (СВУ), Raspberry Pi. |
Ссылка на статью обязательна |
http://psta.psiras.ru/read/psta2017_7_135-149.pdf |
цифровой идентификатор
статьи DOI |
https://doi.org/10.25209/2079-3316-2017-8-1-135-149 |
9
Поступила в редакцию 18.12.2016
Подписана в печать 17.03.2017
21 с.
PDF |
А. А. Беляева, Е. В. Биряльцев, М. Р. Галимов, Д. Е.
Демидов, А. М. Елизаров, О. Н. Жибрик
Кластерная архитектура программно-технических средств организации
высокопроизводительных систем для нефтегазовой промышленности
Проанализирован процесс проектирования и создания
опытного комплексного программно-аппаратного решения организации
высокопроизводительных вычислений, обеспечения хранения больших
данных и трехмерной визуализации в реальном времени для обеспечения
производственных процессов в нефтегазовой отрасли.
Представлены промежуточные технические решения и результаты,
полученные в процессе работ по проектированию соответствующего
специализированного комплекса, обсуждены проблемы и рассмотрены
направления дальнейшего развития названного технологического
направления.
Ключевые слова: численное моделирование,
распределенные вычисления, распределенное хранение, кластер GPU,
нефтегазовый комплекс, платформа высокопроизводительных вычислений. |
Ссылка на статью обязательна |
http://psta.psiras.ru/read/psta2017_7_151-171.pdf |
цифровой идентификатор
статьи DOI |
https://doi.org/10.25209/2079-3316-2017-8-1-151-171 |
10
Поступила в редакцию 20.12.2016
Подписана в печать 17.03.2017
19 с.
PDF |
С. М. Абрамов, В. А. Роганов, В. И. Осипов, Г. А.
Матвеев
Метастохастические адаптивные алгоритмы и их реализация в
супервычислительной среде T++&MPI
На примере предложенного адаптивного численного
метода расчета многомерного определенного интеграла от априори
неизвестной, вычислительно сложной функции, рассматривается общая
методика и программный каркас для построения адаптивных параллельных
решателей,
нацеленных на интеллектуальное многовариантное моделирование сложных
многопараметрических систем.
Ключевые слова:
адаптивный алгоритм, параллельный алгоритм,
метастохастический процесс, масштабируемое моделирование,
многопараметрические системы, многомерный интеграл, метод
Монте-Карло, рекурсивный спуск. |
Ссылка на статью обязательна |
http://psta.psiras.ru/read/psta2017_1_173-191.pdf |
цифровой идентификатор
статьи DOI |
https://doi.org/10.25209/2079-3316-2017-8-1-173-191 |
11
Поступила в редакцию 24.12.2016
Подписана в печать 17.03.2017
16 с.
PDF |
А. В. Баранов, Д. С. Ляховец
Влияние пакетирования на эффективность планирования параллельных
заданий
В статье рассматривается разработанная авторами система
пакетирования параллельных заданий, позволяющая объединять
однотипные задания с длительным временем инициализации в пакеты.
Длительная инициализация влечёт за собой снижение эффективности
использования вычислительных ресурсов и планирования параллельных
заданий.
В статье приводятся результаты экспериментов по исследованию влияния
пакетирования на такие показатели эффективности планирования
параллельных заданий, как полная и полезная загрузка вычислительных
ресурсов.
Ключевые слова:
пакетирование заданий, система пакетной обработки,
СУППЗ, симулятор, эффективность планирования. |
Ссылка на статью обязательна |
http://psta.psiras.ru/read/psta2017_1_193-208.pdf |
цифровой идентификатор
статьи DOI |
https://doi.org/10.25209/2079-3316-2017-8-1-193-208 |