ВИКОРИСТАННЯ SLURM WORKLOAD MANAGER ДЛЯ КЕРУВАННЯ СУПЕРКОМП’ЮТЕРАМИ ТА LINUX КЛАСТЕРАМИ

DOI: 10.31673/2412-4338.2022.024652

  • Дрига В. О. (Dryha V. O.) Державний університет телекомунікацій, Київ
  • Бриксіна М. Д. (Bryksina M. D.) Державний університет телекомунікацій, Київ

Анотація

Стаття присвячена використанню Slurm Workload Manager для керування супер-комп'ютерами та лінукс кластерами і висвітленню важливості та переваг використання Slurm Workload Manager у сфері керування ресурсами на багато-користувацьких системах.
У рамках дослідження були проаналізовані існуючі системи керування навантаженням та їхні обмеження. На основі цього аналізу було виявлено, що Slurm є одним з найпоширеніших і ефективних рішень у сфері керування ресурсами на багатокористувацьких системах.
У статті детально розглянуто функціонал Slurm, включаючи такі основні функції Slurm як планування ресурсів, розподіл завдань та моніторинг стану системи. Slurm надає користувачам можливість ефективно використовувати обчислювальні ресурси, розподіляти завдання між вузлами кластера, забезпечувати оптимальне використання процесорного часу та контролювати навантаження на систему. Ці функції дозволяють досягти високої продуктивності та ефективності при використанні обчислювальних ресурсів.
У статті були викладені переваги Slurm у порівнянні з іншими системами керування ресурсами. Slurm відзначається гнучкістю та можливістю налаштування різних типів ресурсів, а також підтримкою різних алгоритмів планування. Також були зазначені обмеження та проблеми, пов'язані з використанням Slurm, що дає читачам повну картину про його можливості та потенційні виклики, які варто враховувати при його впровадженні.
Ця стаття надасть читачам детальний огляд Slurm Workload Manager, його основних функцій, переваг та обмежень. Завдяки розгорнутому аналізу та опису основних функцій Slurm, стаття стане незамінним джерелом інформації для фахівців, які працюють з великими обчислювальними кластерами та супер-комп'ютерами. Вона також буде корисною для тих, хто бажає ознайомитися з найкращими практиками у галузі керування ресурсами на багатокористувацьких системах і вивчити ефективні стратегії використання Slurm Workload Manager.

Ключові слова: SLURM, Workload Manager, Супер-комп’ютери, Лінукс кластери, Керування ресурсами, Розподіл завдань, Паралельні обчислення, Високопродуктивні обчислення, Шаблони конфігурації, Моніторинг ресурсів.

Список літератури
1. Morgan Tim. Slurm Workload Manager: User's Guide, Version 20.02.7. 2020.
2. МакКеланд Майкл. Керування кластером з використанням Slurm. Linux Magazine, 2016, № 187, C. 76-79.
3. Топчієв Денис, Демченко Андрій. Використання Slurm Workload Manager для керування ресурсами в грід-системах. Матеріали доповідей ХVІ Міжнародної науково-технічної конференції "Сучасні інформаційні технології та інноваційні методики навчання у підготовці фахівців різних напрямів діяльності". Київ, 2017, с. 123-127.
4. Jette, M. A., & Wienke, S. (2015). Slurm: Simple Linux utility for resource management. In High Performance Computing Systems. Performance Modeling, Benchmarking, and Simulation (pp. 269-283). Springer.
5. Lantz, E., Levesque, J., & Seidel, E. (2017). Practical Introduction to Slurm. In Proceedings of the Practice and Experience on Advanced Research Computing (p. 1). ACM.
6. Zhou, H., Wang, J., Zhang, J., & Tang, X. (2019). Performance optimization and evaluation of slurm workload manager. Journal of Ambient Intelligence and Humanized Computing, 10(4), pp. 1517-1526.
7. Chowdhury, S., Santos, R. M., Tordsson, J., & Elmroth, E. (2011). A survey on scheduling techniques for SLA-driven elastic applications in cloud computing. IEEE Transactions on Cloud Computing, 1(2), pp. 110-128.
8. Sterling, T., & Grant, R. (2019). Beowulf Cluster Computing with Linux (2nd ed.). MIT Press.

Номер
Розділ
Статті