Observability und Monitoring: Die feinen Unterschiede Darum ist Observability auf dem Vormarsch

Von Björn Brundert

Anbieter zum Thema

Traditionelle Monitoring Tools stoßen bei modernen Hybrid- und Multi-Cloud-Anwendungen zunehmend an ihre Grenzen. Observability Tools, die Systeme und Infrastrukturen umfassend und übergreifend betrachten und gesammelte Daten aggregieren, gewinnen daher immer mehr an Relevanz.

Björn Brundert, Principal Technologist im Büro des CTO bei VMware, erläutert, warum das klassische Monitoring immer häufiger von so genannten Observability Tools abgelöst wird.
Björn Brundert, Principal Technologist im Büro des CTO bei VMware, erläutert, warum das klassische Monitoring immer häufiger von so genannten Observability Tools abgelöst wird.
(Bild: Lee Tuckett - 07970818931 / VMware)

Der Unterschied zwischen Monitoring und Observability ist nicht immer direkt erkennbar. Zudem werden beide Begriffe oft synonym verwendet, um ähnliches zu beschreiben: eine Organisation oder ein Unternehmen möchte Einblick in den Zustand der eigenen IT-Infrastruktur und die Performance der eigenen Apps gewinnen.

Monitoring wird in Unternehmen schon seit vielen Jahren betrieben und umfasst die Überwachung der Performance eigener Anwendungen und der Stabilität der Infrastruktur. Während Monitoring auf die Überwachung von bekannten Metriken setzt und untersucht, ob es hier zu Abweichungen kommt, geht Observability einen neuen Weg.

Observability ermöglicht es, komplexe Sets von unterschiedlichen Systemen zu verstehen, aus denen eine Anwendung oder Infrastruktur besteht. Und im Gegensatz zum Monitoring geht es nicht nur um vorher festgelegte oder bekannte Schwellwerte und Muster. Beispielsweise meldet Observability nicht nur eine Störung, sondern informiert den Nutzer zugleich über den Ursprung und die Behebungsoptionen eines Problems. Dass Observability zu einem wichtigen Tool moderner IT-Infrastrukturen wurde, belegt die VMware-Studie State of Observability 2022 [PDF, registrierungspflichtig]. 315 IT-Experten, in deren Verantwortungsbereich unternehmenskritische Cloud-Anwendungen liegen, wurden hierfür befragt.

Dabei wurde deutlich, dass die Nutzung von Observability Tools an Dynamik gewinnt. So nutzen aktuell bereits 24 Prozent der Befragten Observability-Tools. Der Wert stieg im Vergleich zum Vorjahr um 5 Prozentpunkte. Und 70 Prozent der Befragten möchten Observability Tools in Zukunft nutzen oder implementierten sie bereits. Von Vorteilen durch den Einsatz berichten 98 Prozent. Als äußerst wertvoll oder sogar notwendig bezeichnen 87 Prozent der Nutzer Observability Tools.

Die Zukunft gehört Hybrid- und Multi-Clouds

Dass Anwendungen in Cloud-Umgebungen laufen, wurde längst zur Normalität in vielen Unternehmen. 89 Prozent der befragten IT-Experten nutzen Applikationen, die hybrid ausgerollt wurden – also Anwendungen, die sowohl in einer Public Cloud als auch On-Prem laufen. Bei 29 Prozent machen diese sogar mehr als die Hälfte aller Anwendungen aus. Mehr als zwei Drittel (68 Prozent) setzen sogar auf Multi-Cloud-Apps, wobei 22 Prozent mindestens die Hälfte ihrer Anwendungen in mehreren Clouds nutzen.

Durch die Einführung verschiedener Cloud-Umgebungen steigt die Komplexität einer Infrastruktur. So wird es immer schwieriger, den Überblick zu behalten. Daher greifen Organisationen vermehrt auf Observability zurück. Denn so fällt es ihnen leicht, komplexe und dynamische Systeme zu überblicken sowie Zusammenhänge und Schnittstellen zu überwachen.

Die Grenzen der traditionellen Monitoring Tools

Ein weiterer Grund für hohe Komplexität und Verflechtung ist die rasant steigende Zahl an genutzten Anwendungen. Das führt dazu, dass traditionelle Monitoring Tools an ihre Grenzen stoßen – besonders wenn es darum geht, Anwendungen und Infrastruktur gleichzeitig zu überwachen.

Dieses Wachstum an Schnittstellen spiegelt sich auch in der VMware-Studie wider: 46 Prozent der Befragten geben an, dass eine Technologie in ihrem Unternehmen Kontakt mit mindestens 25 weiteren hat, bei 10 Prozent sind es sogar mindestens 100. Diese Vielzahl verschiedener Technologien lässt sich mit traditionellem Monitoring kaum noch überblicken. Als Folge klagen 97 Prozent über Probleme beim Monitoring und 84 Prozent sind sich sogar sicher, dass klassisches Monitoring nicht mehr dazu in der Lage ist, moderne Cloud-Anwendungen zu überwachen.

Stichwort Abhängigkeiten: Ein hohes Maß an Komplexität führt außerdem dazu, dass Störungen immer mehr Komponenten gleichzeitig betreffen. Das getrennte Monitoring von Anwendungen und Infrastruktur kann die größeren Zusammenhänge der Problemursachen häufig nicht korrekt abbilden. Daher braucht es einen ganzheitlichen Ansatz, der sofort Einblick in alle vorhandenen Strukturkomponenten und Apps bietet und Überwachung auf einer großen Skala ermöglicht.

Modernisierung: Das Gebot der Stunde

Die Modernisierung der IT-Infrastruktur und Anwendungen ist für immer mehr Organisationen ein zentrales Zukunftsthema. Um die Perfomance von Legacy Apps zu überwachen, reichte klassisches Monitoring aus. Doch nicht nur die Infrastruktur wird durch Modernisierung komplexer, auch die Apps selbst weisen inzwischen ein deutlich höheres Maß an Komplexität auf. Auch das bestätigt die Umfrage: 89 Prozent der Befragten berichten, dass ihre Applikationsportfolios deutlich komplexer wurden, als sie es noch vor 5 Jahren waren.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Softwareentwicklung und DevOps

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

Moderne Apps bestehen aus vielen kleinen unabhängig voneinander funktionierenden Microservices. Inzwischen nutzen 61 Prozent der Stakeholder diese Microservices. Im letzten Jahr waren es dagegen „nur“ 49 Prozent. Ein Tool, welches nun die Stabilität dieser Anwendungen überprüfen soll, muss also eine große Anzahl an Microservices und Containern analysieren können.

Für ein Monitoring Tool war es noch relativ einfach, eine Anfrage in einem monolithischen System nachvollziehen zu können und mit bekannten Mustern abzugleichen. Trifft eine Anfrage nun jedoch auf eine Microservice-Architektur, führt dies oft zu einer Reihe von verschiedenen Konsequenzen, Folgeanfragen und anderen Rückwirkungen. Während klassisches Monitoring hier vor enorme Herausforderungen gestellt wird, sind Observability Tools genau auf solche Systeme ausgerichtet. Indem Observability Feedback-Loops zwischen Instrumenten und der Steuerebene integriert, können sogar direkt Maßnahmen ergriffen werden, um ein Problem zu lösen.

Die ersten Schritte

Entscheidet sich ein Unternehmen nun, die Vorteile von Observability Tools für sich zu nutzen, braucht es eine sinnvolle Architektur. Diese hat die Aufgabe, dafür zu sorgen, dass alle gesammelten Daten an einem Ort zusammengefasst und die richtigen Schlüsse aus diesen gezogen werden können. Das ist Voraussetzung dafür, dass die Ursachen für das Auftreten eines Problems richtig identifiziert werden. Dabei setzt Observability vor allem auf drei Datenquellen:

Metriken: Zahlen wie die Latenz, die Speichernutzung oder der Traffic sind oft der erste Hinweis auf ein Problem. Überschreiten diese einen bestimmten Wert, ist das meist die Konsequenz eines tiefersitzenden Problems.

Traces: Es gibt viele Gründe, warum eine Anfrage länger als erwünscht braucht. Besonders in komplexen Strukturen sind diese oft jedoch nicht immer direkt nachzuvollziehen. Observability Tools folgen der Spur der verzögerten Anfrage, um die Wurzeln des Problems zu ergründen.

Event Logs: Ereignisprotokolle auszuwerten ist kein neues Phänomen. Die Datenmengen, die mittlerweile analysiert werden müssen, sind in modernen Infrastrukturen jedoch enorm angestiegen. Wenn jeder Container oder Microservice seine eigenen Protokolle besitzt, wird dies schnell zu einer unlösbaren Aufgabe für das traditionelle Monitoring. Observability Tools sammeln die zahlreichen Event-Logs an einem zentralen Ort und erleichtern somit ihre Analyse.

Das gute an Observability Tools ist, dass viele Open-Source-Lösungen bereitstehen, um die ersten Schritte in Observability zu gehen. Kostenfreie Tools wie Open Telemetry, Zipkin, Jaeger oder Spring Cloud Sleuth helfen beispielsweise dabei, Trace-Daten zu sammeln. Andere Tools unterstützen einen wiederum bei der Analyse von Event-Logs. Hier profitieren Nutzer zudem von einer großen Community, die das Potenzial von Observability bereits jetzt immer weiter ausschöpft.

Moderne Herausforderungen brauchen moderne Lösungen

Modernisierung und Digitalisierung sind die Grundlage eines zukunftsfähigen Unternehmens, denn sie ermöglichen schnelles Handeln und Anpassungsfähigkeit. Doch eine moderne Applikationslandschaft bringt auch neue Herausforderungen mit sich.

Bjorn Brundert.
Bjorn Brundert.
(Bild: Lee Tuckett - 07970818931 / VMware)

Wer Modernisierung also ganzheitlich voranbringen möchte, muss auch beim Thema Überwachung auf eine moderne Lösung setzen, die der zunehmenden Komplexität und Flexibilität gewachsen ist. Je mehr Organisationen die Modernisierung der eigenen IT vorantreiben möchten, desto mehr gewinnen Observability Lösungen an Bedeutung.

Über den Autor

Björn Brundert ist Principal Technologist im Office of the CTO, Global Field, bei VMware.

(ID:48759518)