Meldungsnummer: 202001231755
Zeitraum: 23.01.2020, ab 17:45
Betroffen: ownCloud
Auswirkungen: Störung behoben
Sehr geehrter Nutzer der GWDG ownCloud,
wir konnten den Ausfall der GWDG ownCloud am Vormittag des 23.01.2020 auf eine zu knapp
ausgelegte Komponente in der Verarbeitung der Anfragen zurück führen.
Diese Konfiguration wurde überarbeitet, der Dienst steht nun wieder in vollem Umfang zur
Verfügung.
Technische Details:
Vor unserem Datenbank-Cluster setzen wir ein Programm ein, welches alle Anfragen nach Lese
und Schreibzugriffen auftrennt und an entsprechende Knoten weiterleitet. Dieses Programm
nutzt als Standardeinstellung nur eine CPU des Servers aus. Die Maschine verfügte aber
über zwei CPUs, daher konnte die CPU-Auslastung auch bei 100% Last durch dieses Programm
nicht über 50% steigen und unserer Überwachung des Servers nicht anschlagen. So erreichte
die Auslastung unbemerkt diese Grenze was zuerst zu einzelnen Fehlermeldungen und im Laufe
des Vormittags schließlich zu einem Ausfall des Dienstes führte.
Nachdem die Konfiguration angepasst und dem Server mehr Speicher- und CPU-Ressourcen zur
Verfügung gestellt wurden, konnte der Dienst wieder in Betrieb genommen werden.