Störung: Teilweise Störung Jupyter-Cloud vom 20.01. 16 Uhr bis 21. 10.30 Uhr behoben

Meldungsnummer: 202201211748
Zeitraum: 20.01 16 Uhr bis 21.01 10.30 Uhr
Betroffen: Jupyter-Cloud
Auswirkungen: Störung

Gestern, dem 20.01. um ca. 16 Uhr, trat eine teilweise Störung des Dienstes Jupyter-Cloud auf, die heute am 21.01. gegen 10.30 Uhr behoben werden konnte.

Die Auswirkung war, dass sich ein Teil der Benutzer zwar am Dienst anmelden konnten, ihr Notebook-Server aber mit einer Fehlermeldung nicht gestartet werden konnte.

Das Problem betraf nur den Teil der Benutzer, die dem neueren, im ESX-betriebenen Teil des Dienstes zugeordnet sind, besonders neue und neuere Benutzer des Dienstes.

Zur Vermeidung von Nebenwirkungen wurden nach der Behebung alle laufenden Notebook-Server gestoppt. Aktuell angemeldeten Benutzern wurden danach über die Webseite des Dienstes der Neustart ihres Notebooks vorgeschlagen.

Ursächlich war das Erschöpfen eines Indexes im Kernel des Server, in dem Schlüssel für Authentifizierung, Verschlüsselung und ähnliche Informationen von Anwendungen verwaltet werden. Im neueren Teil des Dienstes laufen die Notebook-Server in einem Docker mit eingeschränkten Kontext, abweichend vom Standard in Docker. In diesem Kontext ist die Größe des Indexes ebenfalls stark begrenzt, welcher dann in unserem Dienst schnell ausgeschöpft war. Eine dauerhafte Vergrößerung des Indexes hat das Problem behoben.