Анализ данных о загрузке высокопроизводительных платформ пользовательскими задачами на примере гетерогенной вычислительной платформы HybriLIT
Основное содержимое статьи
Аннотация
Актуальность исследования, приведенного в данной статье, заключается в возможности агрегировать статистическую информацию об использовании ресурсов платформы различными группами пользователей. В статье проводится анализ данных по использованию ресурсов учебно-тестового полигона платформы HybriLIT, на основе которого можно построить модели для прогнозирования дальнейшей загруженности платформы с целью рационального распределения имеющихся вычислительных ресурсов и системы хранения данных, а также повышения эффективности их использования. Цель работы – представить исследования, направленные на интеллектуальный анализ данных используемых ресурсов при запуске задач различными группами пользователей и времени их выполнения на учебно-тестовом полигоне платформы HybrLIT. Гетерогенная вычислительная платформа HybriLIT, состоящая из учебно-тестового полигона и суперкомпьютера «Говорун», является частью многофункционального информационно-вычислительного комплекса Лаборатории информационных технологий им. М.Г. Мещерякова Объединенного института ядерных исследований. Платформа имеет гетерогенную структуру вычислительных узлов и позволяет запускать параллельные приложения для проведения расчетов на различных вычислительных архитектурах. Сводная информация о запущенных на HybriLIT задачах, автоматически записывающаяся в базу данных менеджером и планировщиком ресурсов SLURM, представляет интерес для анализа. В результате был проведен глубокий анализ данных по нескольким критериям для каждого ресурса и для каждой группы пользователей учебно-тестового полигона гетерогенной платформы HybriLIT.
Скачивания
Информация о статье
Библиографические ссылки
Список мощнейших суперкомпьютеров мира TOP500. URL: https://www.top500.org/.
МИВК. Многофункциональный информационно-вычислительный комплекс ОИЯИ. URL: https://micc.jinr.ru/.
Гетерогенная платформа «HybriLIT». URL: http://hlit.jinr.ru/.
Batch Docs. Планировщик заданий SLURM. URL: https://batchdocs.web.cern.ch/linuxhpc/index.html.
Абдрахманов М. И. Pandas. Работа с данными. — 2-е изд. — Devpractice Team, 2020. — 171 c.
Нуньес-Иглесиас Х. Элегантный SciPy / Х. Нуньес-Иглесиас, Х. Дэншоу, дер,Уолт Ван. — ДМК Пресс, 2018. — 336 c.
Бизли Д. Python. Книга рецептов / Д. Бизли, Б. К. Джонс. — ДМК Пресс, 2019. — 646 c.
Абдрахманов М. И. Библиотека Matplotlib. — Devpractice Team, 2019. — 125 c.
Орельен Ж. Прикладное машинное обучение с помощью Scikit-Learn, Keras и TensorFlow. Концепции, инструменты — 2-е изд. — Диалектика, 2020. — 1040 c.
Инструкция по работе. Буклет «Гетерогенная платформа HybriLIT». URL: http://hlit.jinr.ru/for_users/user_guide/#_3.