Гибридная суперкомпьютерная система (кластер)

Гибридная суперкомпьютерная система включает в себя:

  • Вычислительную систему, объединяющую кластер CPU (центральных процессоров) x86/64 – на базе процессоров Intel Xeon, и кластер GPU (графических процессоров) – на базе процессоров NVidia Tesla.
  • Модуль системы хранения данных на базе оборудования Sun Microsystems.

  • Инновационную модель программирования, позволяющую объединить вычисления, использующие CPU и GPU.

  • Инновационную программную систему, которая управляет выполнением проекта, использующего гибридные вычисления, и предоставляет прозрачный интерфейс для работы пользователей с системой на базе web-технологий.

Краткое описание

На сегодняшний день в распоряжении ОмГТУ находится пять вычислительных узлов с архитектурой CPU (mgr, cn01, cn02, cn03, cn04). Каждый вычислительный узел включает два 4-ядерных процессора HP X5472 DL 160G5. Пиковая производительность достигает 1 Tflop, а объем оперативной памяти составляет 40GB.

К суперкомпьютеру добавлен также вычислительный узел cn05, осуществляющий управление кластером GPU на платформе NVidia Tesla 10 c архитектурой CUDA GPU. Узел представляет собой персональный компьютер с подключенными к нему ячейками NVidia Tesla S1070, каждая из которых включает в себя 4 GPU с суммарной пиковой вычислительной мощностью 4 Tflops в операциях с одинарной точностью. То есть производительность всей системы достигает 5 Tflops. Для выполнения параллельных вычислений используется NVidia CUDA API для языков программирования C, C++, Fortran.

Другим дополнением является модуль хранения данных (ssd) на базе системы Sun StorageTek 9900V. Данная система отличается высокой отказоустойчивостью.

Все узлы объединены в локальную высокоскоростную сеть (1Gb/сек). Параллельное выполнение программ осуществляется с помощью технологий MPI и CUDA. Поддерживаемые реализации MPI: OpenMPI, HPMPI, MPICH.

Для управления кластером один из его узлов выделен как управляющий (mgr), при необходимости он может быть использован для вычислений. На управляющем узле установлена авторская программная система для управления проектами на кластере (HIG_Cluster_Pack). С её помощью узел принимает и выполняет команды авторизованных пользователей через Интернет. Все соединения осуществляются по защищенному HTTPS протоколу.