Суперкомпьютерные центры РАН объединяются для совместной работы
Суперкомпьютерные центры Российской академии наук использовали субсидию ФАНО для того, чтобы выйти на новый уровень работы и создать сеть, которая свяжет их в единую систему. Работая в такой системе, суперкомпьютерные центры уменьшат время простоя за счёт разделения задач и закроют больше заявок от академических институтов. Запуск полной сети намечен на 2019 год. Сотрудники РАН подробно рассказали об этом на Национальном Суперкомпьютерном Форуме в Переславле (30 ноября 2017 года).
Весной 2017 года суперкомпьютерные центры РАН обновили своё оборудование. Это уменьшило дефицит их мощностей и подвело к мысли о том, как поднять работу на новый уровень.
Игорь Куликов (Институт вычислительной математики и математической геофизики СО РАН) сообщил, что субсидия в 60 млн рублей позволила установить в Сибирском суперкомпьютерном центре новый кластер НКС-1П. Эта гибридная суперЭВМ оснащена 40 процессорами Intel Xeon (640 ядер) и 16 ускорителями Xeon Phi (1152 ядра), её пиковая производительность 82 Тфлопс. Машина обслуживает запросы институтов РАН в Новосибирске, Томске, Красноярске, Иркутске, Омске и Барнауле. С весны 2017 года в ССЦ работают уже два суперкомпьютера, они хорошо загружены.
Содержание Сибирского СКЦ обходится в 12,3 млн рублей в год. За 2016 год с его помощью выполнены научно-исследовательские работы на 600 млн рублей.
Однако запросы учёных растут. Для ускорения расчётов создан распределённый вычислительный комплекс, куда вошли ресурсы МСЦ и ССКЦ РАН.
Межведомственный суперкомпьютерный центр РАН (Москва) и Сибирский СКЦ (Новосибирск) связаны зашифрованным 10-гигабитным каналом. Эта магистраль позволяет обрабатывать данные, собранные в Новосибирске, на московских суперкомпьютерах. Переход от локального к сетевому хранилищу уменьшает скорость обработки данных всего лишь в два раза, хотя расстояние между ними превышает 3 тысячи километров.
Это пилотный проект, на котором два суперкомпьютерных центра учатся работать в единой сети.
Переходя к широким планам, Антон Баранов (МСЦ РАН) рассказал о проекте национальной сети суперкомпьютерных центров коллективного пользования. Основная цель проекта — обеспечить условия для активного применения высокопроизводительных вычислений в научно-технических проектах для развития России.
Эффективность использования ресурсов сети вырастет при оперативном распределении вычислительной нагрузки. Задачи перегруженного ЦКП можно передать в недогруженный ЦКП. Это позволит преодолеть диспропорции в экономическом развитии регионов, отправляя задачи в крупные суперкомпьютерные центры.
Пилотный проект МСЦ РАН и ССКЦ СО РАН будет закончен в феврале 2018 года. Летом 2018 года будут подключены ещё два центра коллективного пользования. Вслед за ними до конца года в сеть войдут все суперкомпьютерные центры РАН. В 2019 году будет разработан открытый интерфейс, чтобы подключать к сети суперкомпьютеры других предприятий.
В сети суперкомпьютерных установок будет работать глобальная очередь заданий, которую формируют сами пользователи. Каждый ЦКП будет принимать задания из глобальной очереди на своих условиях, согласно своей политике, выбирая задачи по характеристикам или открывая часть своих ресурсов. Сеть будет построена на закрытых каналах связи. Центры коллективного доступа смогут динамически подключаться к ней и отключаться.
В сети появится общая система хранения данных. Часть накопителей каждого СКЦ будет связана в облачную систему с единым пространством имён. Файл, который лежит в общей СХД, будет доступен под единым именем из любого суперкомпьютерного центра.
Мы продолжим освещать выступления отдельных участников НСКФ и достижения этой промышленности.