conference logo

Playlist "Chemnitzer Linux-Tage 2023"

Ressourcenmanagement im HPC via SLURM

David Neujahr

»Ich brauche sofort 100 CPUs für meinen Rechenjob!«
Zum Glück steht ein HPC-Cluster mit hunderten Servern und tausenden CPUs bereit.
Wie verwaltet man nun aber solche Mengen an Hardware-Ressourcen möglichst effizient und fair?
Dieser Vortrag behandelt genau diese Thematik im Zusammenhang mit dem Job-Organisator SLURM.

Folgende Schwerpunkte werden behandelt:

- Was ist Job-Scheduling und wann benötigen wir es?
- Warum SLURM ? Was sind die Alternativen ?
- Anwendungsbeispiele und Demonstrationen anhand einer fiktiven Universität