Высокопроизводительные вычисления

Высокопроизводительные вычислительные машины (кластеры)

В 2006 году открыт Региональный Центр высокопроизводительных вычислений. Центр предоставляет ученым и специалистам Кыргызстана высокопроизводительные вычислительные ресурсы для решения самых сложных задач науки, экономики, долгосрочных прогнозов и предотвращения катастроф. Техническую базу Регионального Центра высокопроизводительных вычислений составляет кластер T-Edge64 на базе 64-х процессоров Intel® Xeon® 3.0 Гц c поддержкой Intel 64 Technology. Осуществляется внедрение технологий параллельного программирования для проведения численных экспериментов, компьютерного моделирования, сбора и обработки больших объемов данных. Разрабатывается прикладное программное обеспечение для задач, требующих больших и сверхбольших объемов вычислений.

Главными направлениями деятельности Центра являются:
  • Предоставление ученым и специалистам Кыргызской Республики высокопроизводительных вычислительных ресурсов, в том числе в режиме удалённого доступа.
  • Оказание научно-методических и практических услуг по организации и проведению численных экспериментов, компьютерному моделированию, сбору и обработке больших объемов данных с использованием технологий параллельных вычислений.
  • Разработка прикладного программного обеспечения, включающих в себя задачи, требующие больших и сверхбольших объемов вычислений.
  • Оказание услуг по переводу ранее созданных алгоритмов и программ на суперкомпьютерные технологии с использованием параллельных вычислений.
Общий вид кластера и монтажных стоек
Общий вид кластера и монтажных стоек
Рабочие станции суперкомпьютера с решателем Tesla K40
Рабочие станции суперкомпьютера с решателем Tesla K40

Техническая справка по кластеру T-Edge64:

Месяц и год выпуска август 2006
Место расположения Кыргызско-Российский Славянский университет   г. Бишкек
Число вычислительных узлов/процессоров 32/64
Тип процессора Intel® Xeon® 3.0 GHz с поддержкой Intel 64 Technology
Оперативная память на выч. узле 32x2GB = 64Gb
Дисковая память на выч. узле 32x120GB = 3.8Tb
Дисковая память на упр. узле 2x1Tb = 2Tb
Топология и тип системной сети Myrinet
Тип управляющей (вспомогательной) сети Gigabit Ethernet
Конструктив вычислительного узла (форм-фактор) 1U
Пиковая производительность 384 GFlops
Производительность на тесте Linpack 286 GFlops (74% от пиковой)
Операционная система SUSE Linux Enterprise Server 9.0

Вычислительные эксперименты по тематике «Моделирование сейсмического воздействия массовых взрывов» проводятся на стационарной рабочей станции с техническими характеристиками представленными ниже.

Название Характеристика
Процессор Intel Core i7-4770K CPU @ 3.5ГГц 3.5ГГц
Оперативная память 16Гб
Дисковое пространство 2Тб
Графическая карта Nvidia GTX680
Графическая карта (решатель) Nvidia GTX770

Основная нагрузка вычислительного процесса приходится на графическую карту Nvidia GTX770 и обусловлена тем, что все вычислительные процедуры реализованы с возможность использования технологии параллельного программирования CUDA, разработанной компанией Nvidia.

Название Значение
Количество ядер CUDA 1536
Тактовая частота 1045 МГц
Скорость передачи данных 7010 МГц
Объем памяти 4096 Мб
Пиковая производительность для вычислений одинарной точности с плавающей точкой 3 Tflops

Для оценки производительности решателя проводилось сравнительное тестирование решателей реализованных для работы, с использованием ресурсов одного процессора вычислительной системы; и для работы с использование ресурсов видеокарты Nvidia GTX770.

Размерность модели Объем памяти Время затрачиваемое на 50 итераций (cек) Время на все итерации (сек)
2808960 (112м х 110м х 30м) 261 МБайт 1.82 728
2808960 (112м х 110м х 30м) 261 МБайт 22.31 8924

Таким образом, вычислительный процесс, реализованный с учетом возможностей технологии CUDA на базе графической карты Nvidia GTX 770 позволяет добиться прироста производительности почти 12 раз. В свою очередь, сравнение технических характеристик NVidia GTX770, разработанной на базе вычислительной архитектуры Nvidia Kepler K4 с техническими характеристиками специализированных решателей, разработанных на базе вычислительной архитектуры Kepler не ниже версии K40 позволяет предположить увеличение производительности за счет применения технологии динамического параллелизма, а также за счет использования технологий обмена данными, предусмотренными в архитектуре вычислительного кластера на базе решателя Nvidia Tesla. С другой стороны, вычислительные эксперименты максимально приближенные к реальным условиям требуют использования моделей размерность от 5млрд элементов, что позволит с необходимой степенью точности аппроксимировать пространство размерами 2000м х 1000м х 1000м.

Ключевые возможности

Tesla K40

Tesla K20X

Tesla K20

Tesla K10

Производительность GPU

1 Kepler GK110B

1 Kepler GK110

2 Kepler GK104s

Пиковая производительность для вычислений двойной точности с плавающей точкой

1.43 Tflops

1.31 Tflops

1.17 Tflops

0.19 Tflops

Пиковая производительность для вычислений одинарной точности с плавающей точкой

4.29 Tflops

3.95 Tflops

3.52 Tflops

4.58 Tflops

Полоса пропускания памяти (без ECC)

288 GB/s

250 GB/s

208 GB/s

320 GB/s

Размер памяти (GDDR5)

12 GB

6 GB

5 GB

8 GB

Ядра CUDA

2880

2688

2496

2 x 1536