Humboldt-Universität zu Berlin - Künstliche Intelligenz an der HU

Humboldt-Universität zu Berlin | KI@HU | News | Slurm fertig eingerichtet (26.2.2024)

Slurm fertig eingerichtet (26.2.2024)

Der Slurm Workload Manager, früher bekannt als Simple Linux Utility for Resource Management (SLURM), wird nun auch im High Performance Computing Cluster der HU Berlin genutzt.


Der Slurm Workload Manager, früher bekannt als Simple Linux Utility for Resource Management (SLURM) oder einfach Slurm, ist ein freier und quelloffener Job Scheduler für Linux und Unix-ähnliche Kernel, der von vielen Supercomputern und Computerclustern verwendet wird.

Er bietet drei Schlüsselfunktionen:

  • Zuweisung des exklusiven und/oder nicht-exklusiven Zugriffs auf Ressourcen (Computerknoten) an Benutzer für eine bestimmte Zeitspanne, damit diese ihre Arbeit erledigen können,
  • Bereitstellung eines Rahmens für das Starten, Ausführen und Überwachen von Arbeit, typischerweise eines parallelen Jobs wie Message Passing Interface (MPI) auf einer Reihe von zugewiesenen Knoten, und
  • Schlichten von Ressourcenkonflikten durch Verwalten einer Warteschlange anstehender Aufträge.

Slurm verwendet einen Best-Fit-Algorithmus auf der Grundlage der Hilbert-Kurven-Planung oder der Fat-Tree-Netzwerktopologie, um die Lokalität der Aufgabenzuweisungen auf Parallelrechnern zu optimieren.