Meldungsnummer: 202208011536
Zeitraum: 31.7.22 bis 1.8.22, 9 Uhr
Betroffen: Nutzer*innen von jupyter-cloud.gwdg.de
Auswirkungen: Dienst ist wieder verfügbar
Die Störung des Dienstes Jupyter-Cloud wurde heute um kurz vor 9 Uhr behoben.
Die Störung begann am Sonntag um 08 Uhr, als ein automatische Aufräumprozess fälschlicherweise das für Notebook-Server-Container erforderliche Docker-Image entfernte. Im Ergebnis waren es danach für Benutzer nach erfolgreicher Anmeldung nicht mehr möglich, ein Notebook zu starten und eine entsprechende Fehlermeldung wurde im JupyterHub angezeigt.
Nachdem das Image heute morgen wieder auf den Dienst herunter geladen wurde, stand der Dienst sofort wieder zur Verfügung. Der Aufräumprozess ist abgeschaltet und wird entsprechend überarbeitet.
Ein automatischer Aufräumprozess existiert, um ältere Kopien des Notebook-Images zu entfernen und damit den Speicherverbrauch gering zu halten. Ältere Kopien entstehen durch Updates der Notebook-Images durch einen neuen, ebenfalls halb-automatischen Prozess, um in Zukunft Updates und Änderungen an den Notebook-Images schneller und einfacher durchführen zu können. Im Rahmen der Arbeiten dazu wurde in der letzte Woche allerdings auch der mangelhafte Aufräumprozess installiert.