|
|
• Содержание выпуска • • Искусственный интеллект, интеллектуальные системы, нейронные сети • • Программное и аппаратное обеспечение распределенных и суперкомпьютерных систем • • Информационные системы в экономике •
Программное и аппаратное обеспечение распределенных и суперкомпьютерных
систем
Ответственный за рубрику:
д.ф.-м.н., чл.-корр. РАН Абрамов С.М.
16
Поступила в редакцию 07.06.2011
Подписана в печать 04.07.2011
12 с.
PDF |
Тютляева Е.О., Московский А.А./Tyutlyaeva
E.O., Moskovskii A.A./
Методы обеспечения отказоустойчивости в библиотеке шаблонных классов
C++ для распараллеливания T-Sim
/T-Sim fault tolerance/
В работе рассматриваются проблемы
отказоустойчивости параллельных приложений при работе на
распределенных вычислительных установках. Увеличение масштабов
современных вычислительных систем приводит к увеличению вероятности
отказа отдельных элементов системы. В ряде случаев вычислительные
алгоритмы, такие как генетические алгоритмы, алгоритмы, использующие
метод Монте–Карло и т.п., допускают возможность отказа одного или
нескольких элементов. В статье предлагаются методы для реализации
таких алгоритмов и обеспечения их работоспособности при условии
программных и аппаратных сбоев на вычислительных узлах. В рамках
библиотеки С++ T-Sim разработан пример редукционного (монотонного)
объекта, а также нескольких альтернативных механизмов перезапуска
заданий. Проведены пробные отказоустойчивые реализации алгоритма.
/This paper addresses fault-tolerance challenges in distributed
computing environment. Increasing scalability of modern
computational clusters leads to an increasing probability of an
interrupt occuring. In a number of cases computational algorithms,
such as genetic algorithms, Monte Carlo based algorithms, have the
mathematical properties that they get the correct answer despite the
occurrence of faults in the system. This paper proposes methods for
implementation such class of algorithms despite software and
hardware faults. Some example of monotonous reducing object is
implemented using C++ template class library T-Sim. Moreover, some
test realizations are implemented./
Ключевые слова: отказоустойчивость, локальная синхронизация,
монотонный объект, распределенные системы, шаблонные классы С++.
/Key words: fault-tolerance, T-Sim C++ template library,
monotonous object, local synchronization./ |
Ссылка на статью обязательна |
0421100139\0016 http://psta.psiras.ru/read/psta2011_3_17-28.pdf |
17
Поступила в редакцию 22.09.2011
Подписана в печать
30.09.2011
8 c.
PDF |
Кузнецов А.А., Роганов В.А./Kuznetsov
A.A., Roganov V.A./
Поддержка отказоустойчивых хранилищ данных в системе OpenTS
/Cloud data storage support in the OpenTS parallel programming
system/
В статье рассматривается технология поддержки
внешних отказоустойчивых хранилищ для счетных данных в системе
параллельного программирования OpenTS. Такие хранилища могут быть
использованы для улучшения свойства отказоустойчивости счета
параллельных Т++-приложений.
/The article describes a software technology for
support of external fault-tolerant data storage in the OpenTS
parallel programming system. This type of storage may be used to
improve the fault-tolerance capabilities of T++ applications./
Ключевые слова: облачные хранилища
данных, распределенные вычисления, динамическое распараллеливание
программ, Т-система с открытой архитектурой, отказоустойчивость.
/Key words: cloud data
storage, distributed computing, dynamic program paralleling,
T-system with an open architecture, fault-tolerance./ |
Ссылка на статью обязательна |
0421100139\0017 http://psta.psiras.ru/read/psta2011_3_53-60.pdf |
• Содержание выпуска • • Искусственный интеллект, интеллектуальные системы, нейронные сети • • Программное и аппаратное обеспечение распределенных и суперкомпьютерных систем • • Информационные системы в экономике •
|