Wie Observability IT-Führungskräften dabei hilft, ihre Organisationen proaktiver zu machen

Durch Erkenntnisse aus Performancedaten zu positiven Geschäftsergebnissen

alert-management.jpg
Wichtigste Erkenntnisse
  • Observability kann dabei helfen, aus einer reaktiven IT-Organisation eine proaktive zu machen.
  • Um schlechte User Experiences zu verhindern, müssen Probleme erkannt werden, bevor sie sich auf die Endnutzer:innen auswirken.
  • Zur Verbesserung der MTTR-Metrik (Mean Time To Resolution) werden Echtzeitsignale benötigt.

In der Lingua franca der modernen IT-Architektur ist „Latenz“ die perfekte Metapher für ein Unternehmen, das zu langsam reagiert. Dort, wo die Latenz einer Organisation problematisch ist, bleiben die Operations-Teams immer einen Schritt zurück – statt Ereignisse vorwegzunehmen, müssen sie auf sie reagieren. 

Aber so muss es nicht bleiben! 

Nehmen wir zum Beispiel Wells Fargo. Dieser im kalifornischen San Francisco beheimatete multinationale Finanzdienstleister hat erkannt, dass er zur Messung der Performance seiner Unmengen an Anwendungen eine moderne Observability- und APM-Lösung braucht. Eric Chho, Vice President of Engineering bei Wells Fargo, ist für die Sicherstellung der Observability für die vielen Anwendungsteams in der sehr verzweigten IT-Organisation von Wells verantwortlich. Er sagt, dass es für die Verbesserung der Gesamt-Customer-Experience entscheidend ist, „goldene Signale“ für die Verbesserung der Anwendungsverfügbarkeit und die Reduzierung der Latenz messen zu können.

Letztendlich sei es so wie im berühmten Spruch „Daten sind das neue Erdöl“, so Chho: „Wir haben diese ganzen Rohstoffe, können sie aber nicht schnell genug verarbeiten. Darum ist die Suche so wichtig. Man ist nur so gut oder so schnell, wie man in der Lage ist, [die Daten] zu erkunden.“

Für Sajai Krishnan, General Manager, Observability bei Elastic, sind kostengünstige Einblicke in die gesamte Umgebung, über alle Anwendungen und den Multi-Cloud-Infrastruktur-Stack hinweg, für den Erfolg der Unternehmensmission unabdingbar. „Führungskräfte möchten nicht aus den sozialen Medien von Kundenproblemen erfahren – sie möchten potenzielle Problembereiche proaktiv angehen.“

Die Verwandlung der IT-Organisation von einer reaktiven zu einer proaktiven Organisation beginnt mit der Einführung einer Observability-Lösung für das Ingestieren und Analysieren der eingehenden Telemetriedaten. Eine Observability-Plattform kann automatisch Alerts generieren, wenn Anomalien festgestellt werden. Die Erfassung und die Analyse der eingehenden Performancedaten versetzen das IT-Team in die Lage, strategische Ziele wie eine schnellere MTTR und eine Systemverfügbarkeit von 99,999 % zu erreichen. Durch proaktives Monitoring lassen sich Probleme aufspüren und vermeiden, bevor sie sich auf die Endnutzer:innen auswirken, was besonders bei Anbietern mit einer CDN-Plattform essenziell ist, die von vielen Leuten genutzt wird.

Proaktives Handeln mit Daten

Alert-Management macht den Unterschied. 

Viele Monitoring-Systeme lassen sich nicht adäquat skalieren, um die exponentiell wachsenden Mengen von Performancedaten aus Clouds, Diensten, Netzwerken, dem Internet der Dinge und verteilten Systemen zu bewältigen. Auch wenn es die eine oder andere Organisation geben mag, für die es funktioniert, mit mehreren Performance-Monitoring-Tools zu arbeiten, war Wells Fargo auf der Suche nach einer Möglichkeit, Daten ohne Einführung eines einheitlichen Datenformats oder ohne Umleitung der Daten in Silolösungen zu analysieren.

„Einbindung der Nutzer:innen ist der Schlüssel“, ist sich Chho sicher. „Es reicht einfach nicht, die Technologie zu entwickeln und dann zu erwarten, dass sie schon angenommen werden wird. Wir achten darauf, partnerschaftlich mit den verschiedenen Gruppen zusammenzuarbeiten, um so die Anwendungsfälle besser zu verstehen und herauszufinden, wo die Technologie sinnvoll eingesetzt werden kann.“ Um den Punkt zu erreichen, an dem Observability auch in Selbstbedienung genutzt werden kann, braucht es ein entsprechendes Alert-Management, das für weniger Reibung sorgt und die Akzeptanz erhöht. Chho denkt bei der Verwaltung der Observability-Lösung von Wells Fargo ständig darüber nach, wie es gelingen kann, die Entwicklungsteams schnell produktiv werden zu lassen. „Mein Ziel ist es im Grunde genommen, mich ganz herauszunehmen und die Dienste automatisiert bereitzustellen.“

Tests sind eine Möglichkeit für Organisationen, proaktiv zu handeln. Dabei werden häufig Dinge getestet, die sich unter dem Begriff „User Journey“ zusammenfassen lassen – ob Produktsuche, Kaufabwicklung oder einfach nur der Anmeldevorgang. Observability-Systeme können Organisationen dabei helfen, die Quelle von Problemen, wie z. B. unzureichend performende B2B-SaaS-Anwendungen (für Bonitätsprüfungen usw.), ausfindig zu machen. Die frühzeitige Erkennung von Problemen, inklusive der sofortigen Benachrichtigung, hilft zu verhindern, dass aus schlechten User Experiences Umsatzeinbußen erwachsen.

Eine weitere Möglichkeit für Operations-Teams, proaktiv zu werden, ist das Trending von Performancedaten für bestimmte Zeiträume. Die Automatisierung eines Prozesses wie der Überwachung der Performance der CRM-Anwendung kann dazu beitragen, dass Ops-Teams nicht mehr jeden Dashboard-Bericht einzeln händisch prüfen müssen. Wenn eine Anwendung dienstbezogene Ziele nicht erreicht, können Ops-Teams mithilfe von Observability die Quelle des Problems ermitteln.

Schnellere Problemlösung

Ein anderes Beispiel: Für Jaguar Land Rover war die Errichtung einer Observability-Plattform mit der Einrichtung von Alerts für kritische Produkt-Lifecycle-Management-Daten verbunden, damit die Produktionslinien weiter wie ein gut abgestimmter klassischer Jaguar-E-Type-Sportwagen schnurren können. 

„Ein wichtiger Faktor für die Performance unserer Fahrzeuge und Produktionslinien ist die Qualität der Daten, die unseren Führungsteams und Ingenieuren zur Verfügung stehen“, betont Andy Walker, Senior Project Manager bei Jaguar Land Rover. „Daten gibt es jede Menge und sie müssen stimmen, vollständig sein und umgehend zur Verfügung stehen.“

Jaguar Land Rover nutzt Elastic, um Daten zur Effizienz und Nutzung von Produktions- und Technologieanlagen zu erfassen, darunter zu lizenzierten Werkzeugen, die Hunderte von Millionen von Dollar wert sind, zur Infrastruktur einschließlich der Datenspeicherung und zu Produktionsanlagen. Das System sendet proaktiv Alerts, sobald bei den Daten Anomalien festgestellt werden. 

Eine proaktive Lösung setzt voraus, dass man in Echtzeit erkennen kann, was im System gerade vor sich geht. 

„Monitoring und Observability unterscheiden sich ungefähr so voneinander wie ein Blutdruckmesser von und einem Wearable-Gerät, das mit Cloud-Analytics verbunden ist“, so Sajai Krishnan von Elastic. „Echtzeit-Analytics kann verwendet werden, um Antworten aus großen Beständen von Daten zu erhalten. Damit die Observability-Lösung sinnvoll eingesetzt werden kann, muss sie sich wirtschaftlich sinnvoll skalieren lassen, wenn das Unternehmen wächst.“

On-Demand-Webinar „Observability trends in 2022: A Look into the Future“ ansehen