06. Dezember 2018

Monitoring powered by CANCOM synaix

Monitoring powered by CANCOM synaix (Dean Drobot / shutterstock.com)

Der Ausfall einer Komponente eines IT-Systems oder gar des gesamten IT-Betriebs ist für Unternehmen ein Albtraumszenario – im schlimmsten Fall droht der Ausfall wichtiger Geschäftsprozesse – und das möchte wirklich niemand. In einer solchen Situation informiert gewöhnliches Monitoring den Kunden über einen Vorfall erst dann, wenn es bereits zu spät ist, nämlich nach einem (System-) Ausfall. Viel besser wäre es aber doch, wenn die Warnung bereits im Vorfeld rausgeht und darauf reagiert werden kann, oder?

Proaktiv und vollumfänglich

Hier kommt das proaktive Monitoring System von CANCOM synaix ins Spiel: Durch die Erhebung aller relevanten Daten und durch die aktive Abfrage dieser können Probleme im Vorhinein erkannt und angegangen werden. Dabei gehört Real-Time Monitoring genauso dazu wie Langzeit- oder Capacity, KPI und Performance Monitoring. Es werden also sowohl Daten in Echtzeit als auch über einen definierten Zeitraum sowie Leistungen und Ressourcen überwacht und ausgewertet.

Die durch das Monitoring Tool gewonnene Datensammlung enthält immer einen Datensatz mit vier Feldern. Diese zeigen an, wer (Host) und was (Item, Datenpunkt) überwacht wurde, welcher Wert für das Item gemessen wurde (Item Value, Messwert) und wann der letzte Wert gemessen wurde (Lastclock, Datum & Uhrzeit).

Sobald für ein Item neue Messdaten bestehen, werden die Ist-Werte mit definierten Soll-Werten verglichen und das Tool führt die sogenannten Trigger aus. Gleichen sich Ist- und Soll-Wert NICHT, erhält der Trigger eine von vier Problemstatusstufen. Andernfalls bleibt der Zustand „OK“ bestehen. Wenn der Trigger eine Statusänderung erfährt, d.h. wenn vorab definierte Schwellenwerte erreicht wurden, führt das Monitoring Tool konfigurierte Aktionen bzw. Eskalationsstufen aus, z.B. verschickt es Benachrichtigungen an die verantwortlichen Personen, so dass diese noch vor dem eigentlichen Problem reagieren oder dieses gegebenenfalls eskalieren können. Ganzen Beitrag lesen

23. November 2017

Eventmanagement als Schlüssel für Mitarbeiter- und Kundenzufriedenheit

Eventmanagement als Schlüssel für Mitarbeiter- und Kundenzufriedenheit (Bild: one photo/shutterstock.com)

Probleme im Allgemeinen sind nicht vermeidbar. Selbst bei hervorragender Arbeit und Konzentration übersehen wir Fehler und Inkonsistenzen. Diese erzeugen unter den falschen Bedingungen Probleme, die selbst die bestdurchdachtesten Systeme lahm legen. Dies zu akzeptieren und die Probleme zu nehmen, wie sie kommen, ist eine Art damit umzugehen. Ein anderer und sinnvollerer Ansatz ist solche Probleme vorauszusagen. Wetterexperten sammeln Daten, um Vorhersagen für Unwetter o.ä. treffen zu können. Informationen auf IT-Systemen können ähnlich gesammelt werden, um eine solche Funktionalität abzubilden. Fehlerkultur, wir sind bereit!

Eventmanagement bedeutet Effizienz

Von außen betrachtet ist zweifellos erkennbar, dass eine solche Herangehensweise sowohl Probleme als auch die Zeit, die es braucht, diese zu lösen, reduzieren kann. Die eigentliche Frage ist an dieser Stelle eher, wie viel Mehraufwand das Sammeln und Auswerten der Informationen bedeutet. Gutes Eventmanagement bedeutet, den Mehraufwand gering zu halten und den Nutzen zu vergrößern. Eine umfangreiche und wiederauftretende Problematik muss, genauso wie es ITILv3 uns vermittelt, auch nach ihrer Lösung erneut betrachtet werden:

  • Was ist schief gegangen?
  • Wie gut war unser Lösungsansatz? und vor allem:
  • Wie kann dieses Problem in und für die Zukunft gänzlich gelöst werden?

Ganzen Beitrag lesen

10. August 2017

Fehlerkultur bei synaix

Fehlerkultur bei synaix (Bild: shutterstock.com/Ellagrin)

Während meiner Einarbeitung in das Thema Eventmanagement bin ich auf ein Zitat gestoßen, das mich auf Anhieb beeindruckt hat und das ich spannend finde, weil es sich sehr gut auf den Umgang mit Fehlern bei synaix anwenden lässt:

»Fehler vermeidet man, indem man Erfahrung sammelt.
Erfahrung sammelt man, indem man Fehler macht.«
(Lawrence J. Peter)

Bereits in meinen ersten Tagen bei synaix habe ich erlebt, wie teamübergreifend an einer schnellen Lösung gearbeitet wird, sobald ein Systemfehler auftritt – eine echte Fehlerkultur.

Wichtig: Immer auf dem Laufenden sein

Agilität und schnelles Reagieren sind das A und O in der Welt der Informationstechnologie. Der Workflow der Kunden darf nicht durch Dienste gestört werden. Die IT-Branche entwickelt sich nicht nur technologisch tagtäglich weiter, es ist notwendig, auch die Prozesse und das Handling immer wieder zu überdenken, und aktuelle Gegebenheiten zu bewerten. Ein „ITler“ muss wissbegierig sein und sich stets über Trends, Updates und aktuelle Hackerangriffe informieren. Ganzen Beitrag lesen

02. März 2017

Effizientes Eventmanagement für verteilte Cloud-Lösungen

Effizientes Eventmanagement für verteilte Cloud-Lösungen (Bild: pixabay.com/geralt)

Teamübergreifende Koordination von komplexen Systemumgebungen mit Eventmanagement nach ITIL: die Entwicklung unseres Microservice-Moduls synaix EVENT.

In Zeiten von Docker, AWS und Openstack wollen alle in Richtung DevOps. ITIL als Prozessmodell für den Betrieb von Lösungen hört sich da nach einem Koloss aus vergangenen Tagen an.

Doch auch – oder gerade – im Zeichen von continuous integration müssen die interdisziplinären DevOps-Teams, die für eine komplexe Gesamtlösung verantwortlich sind, den Überblick über Meldungen, Alarme und Trigger behalten. Und auch wenn in der Entwickler- und Admin-Welt durch die aktuelle Umgestaltung quasi kein Stein auf dem anderen bleibt: die Anforderung, dass Geschäftsprozesse rockstable und compliant ausgeliefert werden, gilt weiterhin.

Die Entscheidung: ITIL, aber agil!

Wir haben uns in unseren Teams Gedanken gemacht, welches Vorgehen uns bei diesem Spagat unterstützen kann. Durch Analyse unserer Tätigkeiten und Schwachstellen haben wir herausgearbeitet, dass der Ausbau eines sauberen Eventmanagementprozesses aus dem ITIL-Prozessmodell die nächste Evolutionsstufe ist. Ganzen Beitrag lesen