Das Zeug zur Vorhersage und Vorbeugung
IT-Monitoring ist ein breites Thema, das zur Umsetzung ein tiefes technisches Verständnis erfordert. Vielleicht sind Sie hier gelandet, weil:
- Sie bereits IT-Monitoring betreiben und diese noch weiterentwickeln wollen
- Sie sich mit IT-Monitoring vertraut machen möchten, bevor Sie selbst damit beginnen – sei es in der internen IT oder mit einem externen IT-Dienstleister
- Sie per Zufall hier gelandet sind und eigentlich gar nicht wissen, worum es geht, aber Sie trotzdem weiterlesen, da Sie neugierig sind.
Egal, aus welchem Grund Sie hier sind, am Ende des Beitrags werden Sie verstehen, warum Sie als Kunde im besten Fall nichts von IT-Monitoring Ihres IT-Dienstleisters mitbekommen. Und Sie werden zudem einen Einblick in die Funktionen und Prozesse des Monitorings erhalten. Doch first things first – lassen Sie uns von vorne beginnen.
Was ist Monitoring?
Das Wesentliche von IT-Monitoring lässt sich einfach zusammenfassen: es ist die laufende Überwachung einer Systemumgebung, um sicherzustellen, dass die Hardware sowie Software reibungslos funktioniert. So sind die Aufrechterhaltung aller Anwendungen und Dienste eines Unternehmens gewährleistet. Dazu werden Vorgänge und Prozesse auf ihre Funktionalität überwacht. Das Ziel besteht darin, Probleme frühzeitig zu erkennen, um sie schnellstmöglich beheben zu können.
Wie funktioniert IT-Überwachung?
Die IT-Überwachung umfasst drei Bereiche, die als Grundlage, Software und Auswertung bezeichnet werden.
- Grundlage: Die Infrastruktur ist die unterste Schicht eines Software-Stacks und umfasst physische oder virtuelle Geräte, wie Server, CPUs (Central Processing Units, Hauptprozessor) und VMs (Virtual Machines).
- Die Software: Dieser Teil wird manchmal auch als Überwachungsabschnitt bezeichnet und analysiert, was auf den Geräten in der Basis arbeitet, einschliesslich CPU-Nutzung, Last, Speicher und Anzahl der laufenden VMs.
- Auswertung: Die gesammelten Metriken werden in Form von Diagrammen oder Datentabellen dargestellt, oft auf einem Dashboard. Dies wird meist durch die Integration von Tools erreicht, die sich speziell auf die Visualisierung von Daten konzentrieren.
Real-Time und Trend Monitoring
Es gibt unterschiedliche Arten von Monitoring. Bei der Echtzeitüberwachung (Real-Time Monitoring) handelt es sich um eine Vorgehensweise, bei der IT-Teams mithilfe von Systemen fortlaufend Daten sammeln und diese abrufen, um den aktiven und aktuellen Status einer IT-Umgebung zu ermitteln. Diese Messung, kombiniert mit Daten aus der Vergangenheit, ermöglicht den IT-Managern eine schnelle Reaktion. Beim Trend Monitoring erlauben langfristig gesammelte Überwachungsdaten die Umgebung zu verbessern und präventiv zu handeln, die anhand der aufgezeichneten Muster oder Trends erkennbar sind. Diese langfristige Betrachtung hilft die Qualität der Interventionszeiten (auch basierend auf dem Service Level Agreement) und der Planung aufrechtzuerhalten. Sie sehen, dass auf der einen Seite proaktive Massnahmen eingesetzt werden, um mögliche Probleme frühzeitig anhand von Unregelmässigkeiten zu erkennen, um ihr Auftreten ganz zu verhindern. Auf der anderen Seite gilt es reaktiv zu handeln, sobald Probleme auftreten.
Was überwacht wird
Wie bereits erwähnt, unterliegt die gesamte IT-Infrastruktur der Überprüfung. Für den IT-Betrieb ist besonders das Zusammenspiel der Gesamtlösung wichtig, welche aus verschiedenen Komponenten besteht. So müssen die Schnittstellen, Speicherkapazitäten, Firewalls sowie Anwendungen, Prozesse oder Netzwerke funktionieren. Eine reibungslose Zusammenarbeit der Komponenten ist jedoch schwer erreichbar, da sie von vielen Konfigurationen abhängig ist, die nicht exakt vorhersehbar sind. Hinzu kommen Updates, die für den Computer nötig sind. Das Resultat dieser ineinander spielenden Faktoren sind häufige Fehler, die oftmals unerwartet auftreten können. In diesem Fall, muss gehandelt und die Fehler behoben werden.
Diese Überwachung setzt Systematik und Datenanalysen voraus und benötigt eine regelmässige Überwachung und Betreuung. Diese Betreuung und der Support können einerseits von einem internen IT-Team des Unternehmens abgedeckt werden. Da aber häufig die Ressourcen dazu fehlen und vom Hauptgeschäfts ablenken, wird das IT-Monitoring oftmals von IT-Partnern wie der Unico übernommen.
Tools zur Überwachung
Um längere Ausfälle und Beeinträchtigungen zu vermeiden, wird IT-Monitoring-Software eingesetzt, damit Fehler schnell erkannt werden. Diese sammeln und senden Daten von und zur Systemumgebung. Befindet sich etwas ausserhalb der Norm, löst die Software eine Benachrichtigung aus. So kann zeitnah reagiert werden.
Um die Infrastruktur und das Netzwerk gezielt nach Fehlermeldungen und Schwachstellen zu durchsuchen, wird mittels SNMP (Simple Network Management Protocol) die Hardware abgefragt. Diese fragt alles Mögliche ab, das es zu überwachen gilt. Dazu gehören Kabelmodem, Router, Switches, Server, Workstations und andere Hardware. Viele der softwarebasierten Anfragen erfolgen durch eigenhändig erstellte Scripts. Diese Scripts erstellen wir anhand der Anwendungen, die unsere Kunden nutzen. So stellen wir sicher, dass alles überwacht und abgefragt wird.
Meldungen bei Unregelmässigkeiten
Ein mögliches Szenario für eine Meldung kann eine Warnung von einem Applikationsserver ausgehend sein, auf dem eine Software nicht mehr läuft. Es kann auch vorkommen, dass ein Laufwerk mit installierter Software eingeschränkt wird, wenn der Speicherplatz ausgeschöpft ist. All diese Protokoll-erfragten Meldungen werden mittels einer Monitoring-Software übersichtlich auf einem Dashboard visualisiert. Weiter werden Updates, Antivirus, Backup Services, Uptime überwacht. Wenn etwas nicht im definierten Normalwert läuft, löst das Überwachungsprogramm eine Warnung aus. Somit ist grundsätzlich jede Hardware und jeder Dienst, der über uns läuft, in der Monitoring-Software eingebunden und unterliegt der konstanten Überwachung. Tritt eine Warnung oder ein Problem auf, ist rasches Handeln angesagt.
Welche Vorteile bietet das IT-Monitoring eines externen Dienstleisters?
Wenn Sie so weit gelesen haben, werden Sie verstanden haben, dass ein automatisiertes IT-Monitoring zur Überwachung und Kontrolle der Infrastruktur eingesetzt und von IT-Expert:innen verwaltet wird. Wird dies rund um die Uhr überwacht, können Störungen schnell behoben werden. Ein wichtiger Vorteil beim IT-Monitoring ist das Vorbeugen von Vorfällen, die für ein Unternehmen ein Risiko bedeuten können. Das Monitoring ist dadurch ein wichtiger Bestandteil des Risikomanagements. Und da dies ressourcenaufwändig ist und viel Know-how erfordert, vertrauen viele Unternehmen externen IT-Dienstleistern.
Inside Unico
Diego Mardones ist Cloud Operation Spezialist und das heutige Gesicht hinter dem IT-Monitoring der Unico. Er stellt sicher, dass der Betrieb einwandfrei läuft.
Nicht alle Automatisierungen ersetzen den Menschen
Was Diego auszeichnet, ist das Automatisieren. Ursprünglich aus der Aviatik kommend, kennt er die Automatisierung vom Autopiloten. „Beim Fliegen musst du auch überwachen und schauen, dass alles funktioniert“, meint er im Gespräch mit uns. Das Gleiche gilt für den IT-Betrieb, denn da programmiert er die Überwachung und passt Configuration Files an. „So kannst du die Ressourcen der Mitarbeitenden gezielter einsetzen.“
Praktisch sieht dies im Alltag des Cloud Operation Spezialisten wie folgt aus. In seinem Büro hangen zwei Monitore, die mithilfe der Monitoring-Software Icinga konstant Meldungen publizieren. Seine Aufgabe liegt in der konstanten Überwachung der Benachrichtigungen auf den Monitoren, denn wenn etwas nicht funktioniert, muss er schnell reagieren können.
Auch wenn Sie als Kunde oder Kundin nichts bemerken, es überwacht ständig jemand die Systemumgebung Ihres Unternehmens. Natürlich macht dies Diego nicht allein. Alle Mitarbeitende des Unico Cloud-Teams tragen ihren Teil dazu und garantieren dadurch das konstante Monitoring. Damit niemand Nachtschichten leisten muss, kommt zudem unser Standort in Kanada ins Spiel. So decken wir aus zwei Zeitzonen die ständige Überwachung ab und das Team hat zugleich regelmässige Arbeitszeiten.
Weitere Qualitätsmerkmale
Ich hoffe, dieser Artikel war nützlich für Sie und Sie können besser einordnen, wie Sicherheit im IT-Betrieb gewährleistet wird. Ein weiteres Indiz für Qualität kann anhand Zertifikate wie der ISO-Zertifizierung nachgewiesen werden. Falls Sie gerade festgestellt haben, dass dies ein Bereich ist, dass eine Auffrischung braucht, wird Ihnen diesen Artikel die Antworten geben, die Sie suchen. Und nun wissen Sie auch, an wen Sie sich wenden können, wenn Sie auf der Suche nach einem Partner für einen sicheren IT-Betrieb sind.