Behoben: Störung der DNS- und DHCP-Server beseitigt

Meldungsnummer: 201904300817
Zeitraum: 30.04.2019   ca. 07:20 Uhr bis 9:40; zT schon ab 5:00
Betroffen: Client-Netze im GÖNET inkl. WLAN, einige Dienste der GWDG
Auswirkungen: – Endgeräte konnten sich nicht mit dem Netzwerk verbinden
(bekamen keine IP-Adresse)
– Das Auflösen von Hostnamen und damit die Nutzung von
Internet-Diensten war tw. stark verzögert
– Einige GWDG-Dienste waren als Sekundär-Effekt, ebenfalls
nicht erreichbar

Die Störung wurde behoben und der Betrieb der Endgeräte kann wieder
aufgenommen werden.

Am Dienstag Abend gegen 17 Uhr wird es erneut zu einem kurzen Ausfall
des DNS und DHCP-Dienstes des primären Server 134.76.10.46 kommen.
Bis zur vollständigen Wiederherstellung in diesem Zuge, können
leider keine Änderungen im DNS und DHCP deployt werden. Wir informieren
hierzu in einer 2. Betriebsmeldung.

Hintergrund:

Der primäre DNS-Resolver und DHCP-Server ‚134.76.10.46‘/’gwdu01′ hat
gegen 5 Uhr Dateisystemfehler gemeldet und ist in einen instabilen
Zustand gegangen. Da das System aus 2 Hardware-Servern besteht, wurde
gegen 7:50 Uhr das Umschalten auf das Redundanz-System initiiert. Dies
ist das gängige Verfahren und wird auch regelmäßig in verschiedensten
Situationen so durchgeführt. Leider waren die Fehler auf dem ersten
System derart gravierend, dass ein automatisches Umschalten nicht mehr
möglich war und die Fehler auf dem zweiten System repliziert hat,
wodurch beide den Dienst komplett einstellten.

Zusammen mit unserem Support-Partner konnten wir nach einer Analyse die
bestehenden Datenbanken der Server restaurieren und einen der beiden
Server komplett neu aufsetzen und gegen 9:40 Uhr zunächst ’notdürftig‘
den DNS- und DHCP-Service wieder zur Verfügung stellen.