Serverausfall – Was kann ich tun?
Server sind die zentralen Systeme in jedem Netzwerk und sind 24 Stunden am Tag erreichbar. Unzählige Informationen werden durch sie bearbeitet und Ihnen zur Verfügung gestellt. Sie basieren in den meisten Fällen auf Microsoft Windows. Seltener werden Linux- oder Unix-Server eingesetzt. Ihre Dienste wirken sich in vielen Bereichen positiv aus. Kommt es jedoch zu einem Serverausfall, muss schnell gehandelt werden. Jede Sekunde, die ein Server nicht antworten kann, kostet bares Geld.
Verhaltensweise im Notfall
Schon nach wenigen Stunden kann der Schaden enorme Ausmaße angenommen haben. Mit einem prominenten Beispiel, wie weitreichend ein Serverausfall sein kann, machte Whatsapp im Mai 2014 in Europa und der ganzen Welt Schlagzahlen. Gleich zweimal konnten über eine gewisse Zeitspanne keine Kurznachrichten verschickt werden. Ganz ähnlich erging es Twitter im März 2014. Schon sehr kurz nach dem Ausfall wusste das ganze Internet, dass kein einziger Tweet mehr durchkam. In beiden Fällen arbeiteten die Fachleute pausenlos, um die Serviceleistungen wieder online zu bekommen. Ihnen ist es zu verdanken, dass die User über Whatsapp schnell wieder erreichbar waren. Bei Twitter dauerte es gerade einmal 20 Minuten, bis beispielsweise Rihanna wieder einen Tweet für ihre Fans posten konnte. Was für prominente Dienstleister wie Whatsapp oder dem zwitschernden Vogel gilt, ist auch für Ihre Firma von entscheidender Bedeutung! Wie können Sie bei einem Ausfall schnell und effizient reagieren, damit die Zeit, in der ein Server nicht erreichbar ist, so kurz wie möglich gehalten werden kann?
Wo befinden sich die Server in Ihrem Netzwerk?
Bevor Sie sich mit Serverausfällen beschäftigen, sollten Sie zuerst verstehen, wo sich ein Server in Ihrem Computernetz logisch (bzw. virtuell) und physikalisch befindet. Ihr Netzwerk besteht im Wesentlichen aus den Computern an den Arbeitsplätzen, Druckern und den zentralen Serverstationen. Die Datenwege zwischen den Rechnern werden von Netzwerkkomponenten (sog. Switches und Router) zur Verfügung gestellt, die mithilfe geeigneter Verkabelungstechniken alle Endgeräte miteinander in Verbindung bringen. Damit dies sinnvoll und möglichst effizient geschieht, sind Netzwerke in Teilbereiche unterteilt, die als Subsegmente oder Subnetze bezeichnet werden. Für die Unterteilung gibt es mehrere Beweggründe. Auf jeden Fall werden Ihre Rechner in einem oder mehreren eigenen Subnetzen untergebracht sein, die Ihr PC oder Drucker über die Switches und ggf. Router des Unternehmensnetzes erreichen kann. Dies ist eine rein logische Separation. Physikalisch könnte jedes Endgerät an jedem Ort in Ihrem Unternehmen aufgestellt sein. Geregelt wird dies durch die Netzwerkadministratoren. Sie konfigurieren die Switches und Router, damit die Datenmengen unabhängig vom tatsächlichen Standort von jeder Quelle zu jedem Ziel finden. Ihre Server werden sich in einem separaten Serverraum oder im Rechenzentrum Ihres Unternehmens befinden. Dort sind sie nicht nur vor unbefugten Zutritten geschützt. Derartige Räumlichkeiten verfügen über die notwendige Logistik, um eine sichere Stromzufuhr, die richtigen klimatischen Bedingungen sowie die komplette Verkabelung der Servergeräte zu gewährleisten.
Wie können Sie die ersten Anzeichen für einen Serverausfall erkennen?
Wenn Ihre Nutzer nur noch langsam oder gar nicht mehr auf den Zentralrechner zugreifen können, kann dies ein erstes Anzeichen für einen Ausfall sein. Es gibt aber noch viele andere Ursachen, die für ein derartiges Problem infrage kommen können. Neben Defekten bei den Netzwerkkomponenten können Fehler in der Namesauflösung und einige andere Faktoren dazu führen, dass ein Server nicht mehr antworten kann. Ein sicheres Indiz für Probleme bei einem oder mehreren Servern sind Fehlermeldungen, die an unterschiedlichen Orten auftreten können.
Eine Überwachungssoftware gibt Aufschluss über den Zustand des Rechners und liefert gerade bzgl. der Hardware Informationen, ob diese noch funktioniert. Die Managementapplikation kommuniziert mit ihren auf den Servern installierten „Agenten“, die kontinuierlich nach den Vorgaben der IT-Administration Data über den Zustand des Servers – positiv wie negativ – an die zentrale Überwachungsstation übermitteln. Auch wenn die Einträge in Englisch und nicht in Deutsch geschrieben sind, sollte hier Ihr erster Anlaufpunkt sein, wenn Sie den Verdacht haben, dass ein Server komplett ausgefallen ist. Weitere Indizien für Probleme können Sie den unterschiedlichen Log-Dateien entnehmen. Sowohl das Betriebssystem als auch die meisten Applikationen, die auf den Serverzentralen installiert sind, verfügen über Mechanismen, Dateninhalte in solche Kontrolldateien zu schreiben. Als Ihr Partner bietet Ihnen DIROPA hier eine professionelle Hilfe, die Ihnen viele Geld sparen und Ihre Aufwände minimieren kann. Es gibt noch eine weitere Möglichkeit, Kontakt mit den Servern aufzunehmen. Vorausgesetzt Sie haben einen Account mit einer administrativen Berechtigung dazu, können Sie sich im Rechenzentrum oder über eine spezielle Fernsteuertechnik lokal an den zentralen Rechnern so anmelden, wie Sie es von Ihrem Arbeitsplatzcomputer gewohnt sind. Hier können Fehlermeldungen („Failure“) direkt auf der Anzeige des Bildschirms erscheinen.
Welche Gründe kann es für den Ausfall eines oder mehrerer Server geben?
Ursachen für einen Serverausfall gibt es sehr viele. Als bei einem der größten Social Networks im März 2014 kein Tweet mehr gepostet werden konnte, würde nichts über die Ursachen bekannt. Es hätten Angriffe von außen dafür verantwortlich gewesen sein können. Genauso könnte ein Software-Bug oder ein Fehler in der Hardware als Auslöser infrage kommen. Bei einem Serverausfall in Ihrem Netz gibt es noch mehr Fehlerquellen. Da soziale Plattformen und Co. auf ihre Rechner angewiesen sind, werden sie entsprechend komfortabel ausgestattet und gesichert sein. Das macht Sinn, denn sie bilden mit all ihren Informationen und Mediadaten das Wesen des Geschäftes für diese Firmen. In kleineren Betrieben ist eine derart umfangreiche Absicherung selten anzutreffen. So kann beispielsweise der Defekt einer Netzwerkkarte des Servers zu einer Störung führen, die das Versenden einer E-Mail unmöglich macht. Der für das Mailing zuständige Exchange Server kann auch auf andere Weise ausfallen. Es ist schon vorgekommen, dass der lokal installierte Virenscanner die verschlüsselten Mail-Datenbanken nicht lesen konnte. Als Reaktion darauf blockierte er jeglichen Zugriff auf die Dateninformationen. Ein Totalausfall von Exchange war die Folge. Wenn Ihre Zentralrechner jedoch nicht ausreichend geschützt sind, könnte ein Virenbefall der Grund für den Exodus eines Servers sein. Sind die Geräte nicht durch unterbrechungsfreie Stromversorgungen (USV) abgesichert, gehören Stromausfälle zu den häufigsten Ursachen für Totalschäden. Es sind auch schon Server von allein heruntergefahren, weil die Klimaanlage nicht ordnungsgemäß funktioniert hatte und es im Raum zu warm geworden war. Letztlich können Sie nicht ausschließen, dass Administratoren versehentlich wichtige Dateninfos löschen und Windows oder Ihre Website, Blog etc. in einen instabilen Zustand versetzen.
Welche Erstmaßnahmen sollten erfolgen, wenn ein Server nicht mehr funktioniert?
Für Sie ist es ganz wichtig, die richtige Fehlerquelle ausfindig zu machen. Können die Administratoren noch auf den Server mittels Fernwartung zugreifen? Wenn dies nicht der Fall sein sollte, muss Sie der erste Weg zum zentralen Netzwerkmanagementsystem führen, der die Daten aller Server sammelt. Die Administratoren können wahrscheinlich über eine spezielle Client-Software auf die Management-Konsole zugreifen, wenn sie entsprechend angemeldet sind. Meistens lässt sich hier schon etwas über die Fehlerursache finden.
Zudem hat jeder Hardware-Anbieter seine eigene Überwachungssoftware. Deren Funktion können Sie ebenfalls nutzen. Sollte es nach einem Hardware-Defekt aussehen, muss sofort jemand in den Serverraum gehen und nachsehen. Eventuell muss nur eine Platte ausgetauscht oder die Klimaanlage neu eingestellt und der Server wieder hochgefahren werden. Sehr wichtig ist es, die Mitarbeiterinnen und Mitarbeiter über die Störung zu informieren, damit diese auf einem anderen Speicherort ausweichen können, bevor sie die geöffneten Dateien schließen oder abschießen.
Wie beugen Sie vor, damit es gar nicht erst zu einem Serverausfall kommt?
Schließen Sie bestimmte Fehlerquellen einfach aus. Bauen Sie eine Testumgebung. Das ist ganz wichtig. Nur so können Sie Totalausfälle durch einen übereifrigen Virenscanner oder ein fehlerhaftes Update im Vorfeld herausfinden. Gerade die Software- und Systemaktualisierungen sollten nicht automatisch erfolgen und hinreichend auf ihre Lauffähigkeit getestet werden, bevor Sie sie in die Produktivsysteme einspielen. Geben Sie dem Betriebssystem ausreichend Platz. Durch temporäre Datenvolumina und zahlreiche Updates droht sonst die Gefahr, dass irgendwann zu wenig Platz auf der Systempartition vorhanden ist. Dies wiederum kann das Gerät in die Knie zwingen. Sehr wichtig ist die kontinuierliche Prüfung der Netzwerkanbindung des Serversystems. Gleiches gilt für die Zugriffe auf ausgelagerte Speichersysteme, die über ein eigenes Subnetz mit den Servern verbunden sind. Sie können mit zwei Netzwerkkarten (NIC) eine Redundanz herstellen und mittels einer speziellen Netzwerkkomponente eine Lastverteilung realisieren. So stellen Sie sicher, dass der Ausfall einer NIC keinen Schaden anrichtet und die Datenlast gleichmäßig verteilt wird. Der Virenschutz (Wie erkenne ich einen Virus auf meinem Computer?)sollte gleich dreifach greifen. Die Clients, welche auf die Serversysteme zugreifen, bekommen einen Virenscanner. Die Server selbst erhalten nach einem ausgiebigen Test eine entsprechende Schutzsoftware. Wenn Sie jetzt noch vor Ihrem internen Computernetzwerk einen zentralen Virenscanner-Server einrichten, würde diese Viruswall den Dreifachschutz komplettieren. Weitere Möglichkeiten zum Schutze vor den Gefahren des Internets sind Systeme, die Angriff erkennen oder im Vorwege präventiv verhindern. Diese Services nennen sich IDS (Intrusion Detection System) und IPS (Intrusion Prevention System).
Was kann Diropa bei einem Serverausfall für Sie machen?
DIROPA bietet Ihnen den Service, die Überwachung Ihrer Serversysteme für Sie zu übernehmen. Sie können sich auf die eigentlichen Aufgaben konzentrieren, da die Spezialisten aus Graz sowohl aus der Ferne als auch bei Ihnen vor Ort die richtigen Schlüsse ziehen und Maßnahmen zur Lösung der Fehlerproblematik einleiten können. Mit speziell für das Monitoring aus der Ferne geeigneten Apps und Programmen kann Diropa unmittelbar, wenn die ersten Meldungen vorliegen, mit Ihnen Kontakt aufnehmen und auf die Vorkommnisse in Ihrem Hause reagieren.
Unsere EDV Techniker verfügen über genügend Know-how, um Ihnen die Last und die Verantwortung zu nehmen, die bei den vielen Jobs rund um einen Serverausfall auf Sie zukommen könnten. Neben der Überwachung kann Diropa alle Punkte, die bzgl. der Vorbeugung für einen Serverausfall erwähnt worden sind, für Sie umsetzen und weitere sinnvolle Ergänzungen vornehmen.