Hintergrundinformation Verfügbarkeit
Aus aktuellem Anlass möchten wir kurz einmal die Vorgehensweise bei einem potentiellen Serverausfall erläutern.
Letzten Freitag gab es in unserem Tier-III Hochleistungsrechenzentrum eine Störung der internen Netzwerk-Infrastruktur, und HiOrg-Server war infolgedessen nicht stabil erreichbar.
In einem solchen Fall werden wir innerhalb von wenigen Sekunden durch unser externes Monitoring-System alarmiert, und halten dann sofort Rücksprache mit unserem Rechenzentrum. Da wir davon ausgehen, dass in den meisten Fällen die Techniker des RZ die Erreichbarkeit kurzfristig wieder herstellen können, ist dies zunächst die sinnvollste Lösung für eine schnelle Rückkehr zum Normalbetrieb.
Ist eine längerfristige Störung absehbar, leiten wir eine Umschaltung zu unserem Standby-Rechenzentrum ein. Diese dauert technisch bedingt jedoch mindestens zwei Stunden, da hierzu die DNS-Einträge für unsere Server beim primären DNS-Server geändert, und diese Änderung anschließend zu den DNS-Servern aller Internet-Provider gespiegelt werden müssen. Nach Anstoßen des Umschaltvorgangs kann dieser nicht mehr rückgängig gemacht werden – ein "fröhliches Hin- und Herschalten" ist also nicht problemlos möglich. Unterm Strich geht es in den meisten Fällen also tatsächlich schneller, wenn die Techniker im Rechenzentrum vor Ort die Störungsursache innerhalb weniger Minuten beheben können.
Auch wenn wir für den Ausfall nicht verantwortlich sind, entschuldigen wir uns bei Ihnen für eventuell aufgetretene Unannehmlichkeiten. Leider lassen sich solche Ereignisse auch in einem Hochverfügbarkeits-Rechenzentrum und durch redundante Vorhaltung der gesamten Infrastruktur nicht vollständig ausschließen.
Hinterlasse einen Kommentar
An der Diskussion beteiligen?Hinterlasse uns deinen Kommentar!