Тестовая системаБиблиотека CENTAUR предназначена для создания параллельных программ как для гибридных суперкомпьютеров (в состав которых входят ускорители вычислений), так и для "классических" суперкомпьютеров (без использования ускорителей). Все тесты проводились на суперкомпьютере К-100, установленном в ИПМ им.М.В.Келдыша РАН. Краткие аппаратные характеристики суперкомпьютера К-100:
В общей сложности система состоит из 768 ядер процессоров и 86016 ядер графических ускорителей. Результаты испытанийПомимо значительного повышения продуктивности программирования за счет высокой степени специализации по предметной области, библиотека CENTAUR демонстрирует очень хорошую производительность на модельных задачах. На графике приведены результаты модельной задачи горения в однородной среде, реализованной при помощи библиотеки CENTAUR, в зависимости от количества используемых узлов кластера. Эффективность в гибридном режимеНа графике ниже приведено время счета модельной задачи на разном числе узлов суперкомпьтера с различным количеством используемых графических ускорителей на каждом узле. На графике ниже приведено ускорение (время счета деленное на время счета на одном узле с использованием одного ускорителя) модельной задачи на разном числе узлов суперкомпьтера с различным количеством используемых графических ускорителей на каждом узле. На графике ниже приведено КПД (отношение полученного ускорения к идеальному ускорению (равному произведению количества используемых узлов на количество используемых графических ускорителей)) модельной задачи на разном числе узлов суперкомпьтера с различным количеством используемых графических ускорителей на каждом узле. Результаты показывают, что КПД на 24 узлах суперкомпьютера при использовании трех графических процессорах на каждом узле (используется 72 процессорных ядер и 32256 графических ядер) равно 84.2%. Эффективность в "классическом" режимеНа графике ниже приведены результаты ускорения модельной задачи горения в однородной среде, реализованной при помощи библиотеки CENTAUR, в зависимости от количества используемых узлов кластера и количества задействованных процессорных ядер на каждом узле (кликните по картинке для просмотра в полном размере). |
Библиотека CENTAUR >