AIOps: Wer mit AIOps-Automatik umzugehen versteht

Für den Betrieb komplexer IT-Infrastrukturen fehlen oft die nötigen Fachkräfte. Einen Großteil der Arbeit übernehmen daher immer öfter ML-Technologien. Die sind obendrein schneller und effizienter. Allerdings müssen auch diese Systeme von Fachleuten gepflegt, verstanden und beaufsichtigt werden.

KI kümmert sich um die IT-Landschaften

Von Roland Freist

Die IT-Systeme von großen Unternehmen und Organisationen zeichnen sich durch hochgradig komplexe Strukturen aus, die zudem ständigen Veränderungen unterworfen sind. Multi-Cloud-Umgebungen sind der Normalfall, virtuelle Maschinen werden in Minutenschnelle eingerichtet und oft noch am gleichen Tag wieder beerdigt. Ständig melden sich neue Geräte und Komponenten am Netzwerk an und verlassen es wieder. All diese Veränderungen werden in Protokolldateien und Berichten festgehalten, Hunderte von Sensoren und Tools messen Temperaturen, überwachen Datendurchsätze, kontrollieren Sicherungen und registrieren Zugriffe auf freigegebene Ressourcen.

Dabei entstehen enorme Datenmengen, die von Menschen nicht mehr überblickt werden können. Neue Ansätze sind erforderlich, um die Informationen schnell und möglichst in Echtzeit auswerten zu können. Bereits seit mehreren Jahren kommt bei diesen Aufgaben künstliche Intelligenz zum Einsatz. Das Marktforschungsunternehmen Gartner brachte daher bereits 2014 den Begriff „AIOps“ ins Spiel: Artificial Intelligence for IT Operations. Eine künstliche Intelligenz übernimmt dabei Aufgaben in der lokalen IT, die für Menschen realistisch gesehen nicht mehr zu bewältigen sind.

Sammeln – Analysieren – Reagieren

Eine AIOps-Plattform erfüllt in der Unternehmens-IT gleich mehrere Aufgaben:

  • Sie sammelt die Daten, die von den verschiedenen Infrastrukturkomponenten geliefert werden, und fasst sie zusammen. Zu den Lieferanten gehören unter anderem Anwendungen, Monitoring-Tools aller Art oder auch Ticket-Systeme. Auch die Formen, in denen die Daten vorliegen, variieren stark: Ereignis- und Netzwerkprotokolle, Log-Dateien, Office-Dokumente, Konfigurationsdaten, Fehlermeldungen, eventuell auch Social-Media-Posts und Audiodateien mit gesprochener Sprache. Die Software ist zudem in der Lage, die Daten zu indizieren und sie mit einem Ablaufdatum zu versehen.
  • Mithilfe einer KI analysiert das AIOps-System die eingehenden Daten und achtet dabei auf Auffälligkeiten und Muster, die beispielsweise auf Probleme bei der Anwendungsleistung und -verfügbarkeit oder auch auf sicherheitsrelevante Vorfälle hinweisen. Sie unterscheidet dabei zwischen wichtigen Warnungen und unnötigen Meldungen.
  • Erkennt die AIOps-Software zum Beispiel ein drohendes Systemversagen oder Hinweise auf ein Security-Versagen, so analysiert sie die infrage kommenden Komponenten sowie die möglichen Ursachen und gibt diese Informationen an die IT-Abteilung oder ein Security-Team mit gezielten Handlungsanweisungen weiter.
  • In einigen Szenarien ist das AIOps-System in der Lage, selbstständig mögliche Gegenmaßnahmen zu treffen und die Probleme sofort zu beheben, ohne dass Interventionen von außen erforderlich sind.
  • Soll die IT-Infrastruktur um neue Komponenten erweitert oder durch Softwareupdates auf den neuesten Stand gebracht werden, so lässt sich mithilfe der AIOps-Plattform zuvor schon simulieren, wie sich die Änderungen auf das gesamte System auswirken werden, wo es Probleme geben könnte und welche Abläufe bei der Planung berücksichtigt werden sollten.
  • Als intelligentes System lernt die AIOps-Plattform kontinuierlich aus vorangegangenen Vorfällen und zieht Schlüsse für den korrekten Umgang etwa mit einer Systemmeldung für die Zukunft.

Vorausschauende Sicherheit

Ein AIOps-System lässt sich äußerst flexibel verwenden. Es kann Netzwerke und Cloud-Umgebungen genauso überwachen wie bereitgestellte Dienste und physische Geräte, etwa Server- und Storage-Hardware oder PC-Clients. Stichwort Predictive Analytics bzw. Predictive Maintenance: In vielen Fällen ist es mit AIOps sogar möglich, potenzielle Störungen nicht nur frühzeitig vorherzusagen, sondern sie auch automatisch zu beheben. So könnte beispielsweise der drohenden Überhitzung eines Geräts durch Verlagerung der Workloads auf eine andere Maschine vorgebeugt werden.

Gut geeignet ist eine solche Plattform aber auch für die Überwachung und Einhaltung von Compliance-Vorgaben oder einen Einsatz in der IT-Security. Wird sie entsprechend trainiert, kann eine AIOps-Software die bereits vorhandenen Security-Systeme sinnvoll ergänzen und beispielsweise Denial-of-Service- oder Ransomware-Angriffe bereits bei den ersten Anzeichen erkennen und zuvor festgelegte Schritte zur Aufrechterhaltung der Stabilität der Unternehmens-IT und zum Schutz der Unternehmensdaten einleiten.

Vorteile einer AIOps-Plattform

Mit einem AIOps-System lassen sich viele Aufgaben automatisieren, die durch IT-Abteilungen nicht mehr oder nur noch unzureichend erfüllt werden können. Die wichtigsten Vorteile sehen folgendermaßen aus:

  • Entlastung des IT-Personals: Der personelle Aufwand wird reduziert. Eine AIOps-Software übernimmt viele Arbeiten, die zuvor nur von geschulten Fachkräften erledigt werden konnten, und entlastet so die IT-Abteilung. Die wegen des Fachkräftemangels knappen IT-Spezialisten werden in die Lage versetzt, sich verstärkt anderen Aufgaben wie der Planung und Weiterentwicklung der Infrastruktur zu widmen.
  • Kosteneinsparung: Die Verlagerung der Datensammlung und -analyse von den IT-Mitarbeitern auf die KI führt zu einer Kostenreduktion.
  • Systemübergreifende Stabilität: Eine AIOps-Plattform überwacht die gesamte IT-Landschaft kontinuierlich und rund um die Uhr mit gleichbleibender Intensität und den immer gleichen Ressourcen. Sie hat immer die Gesamtheit aller Systeme im Blick und kann sämtliche eingehenden Daten über die Grenzen von Datensilos hinweg miteinander korrelieren. Sie entfaltet ihre Stärken vor allem in den dynamischen, virtualisierten IT-Umgebungen moderner Unternehmen.
  • Früherkennung: Drohende Probleme lassen sich somit früher erkennen, Gegenmaßnahmen können schneller eingeleitet werden. Die Zeit, bis eine Lösung für ein Problem gefunden und umgesetzt wird, verringert sich drastisch. Das wiederum führt zu einer Reduzierung von Ausfallzeiten und einer Verbesserung der Verfügbarkeit der IT.

Big Data und maschinelles Lernen

Um seine Aufgaben zu erfüllen, setzt ein AIOps-System vor allem auf zwei Methoden: Big-Data-Analysen und Machine Learning. Die umfangreichen Strukturen moderner Unternehmens-IT erzeugen riesige Datenvolumen, die sich mit herkömmlichen Mitteln nicht mehr durchleuchten und nutzbringend einsetzen lassen, zumindest nicht in der notwendigen hohen Geschwindigkeit. Erforderlich sind dafür Big-Data-Analysen, die die eingehenden Informationen möglichst in Echtzeit auswerten und Muster darin erkennen können. Entsprechende Plattformen sind bereits seit mehreren Jahren verfügbar. Mittlerweile haben verschiedene Hersteller auch KI-Systeme entwickelt, die auf Basis dieser Analysen intelligente und begründete Entscheidungen treffen können.

Die Auswertung großer Datenmengen eröffnet gleichzeitig die Möglichkeit, das KI-System damit zu trainieren. Indem man der künstlichen Intelligenz anhand von realen Daten beibringt, welche Ereignisse und Abweichungen ein Eingreifen erforderlich machen und welche nicht, kann sie mit der Zeit auch selbst immer präzisere Einschätzungen liefern. Für ein solches Machine Learning sind heute bereits leistungsfähige Hardware- und Software-Architekturen vorhanden.

ITKarriere 2023 02.jpg

Schwarz auf Weiß
Dieser Beitrag ist zuerst in unserer Magazin­reihe „IT & Karriere“ erschienen. Einen Über­blick mit freien Down­load-Links zu sämt­lichen Einzel­heften be­kommen Sie online im Presse­zentrum des MittelstandsWiki.

Hoher Aufwand bei der Implementierung

Vor der Anschaffung eines AIOps-Systems sollten sich Unternehmen allerdings über einige andere Punkte klar sein. Eine solche Plattform spart zwar auf lange Sicht Kosten ein. Doch ihre Implementierung ist zunächst einmal kostenintensiv. Sie bringt nur Organisationen mit umfangreichen IT-Infrastrukturen und zahlreichen Datenquellen messbare Vorteile.

In Betracht gezogen werden muss außerdem, dass es sich um eine komplexe Software handelt, deren Implementierung, Wartung und Verwaltung einen hohen Arbeitsaufwand nach sich zieht. Die Anbindung an die diversen Datenquellen allein ist bereits aufwendig, hinzu kommt jeweils das Training der Software anhand der vorhandenen und neu gesammelten Daten. Denn ein AIOps-System kann immer nur so gut sein wie die Daten, mit denen es gefüttert wird, und die Algorithmen, mit denen man es geschult hat. Bis die Plattform auf die Infrastruktur des Unternehmens eingestellt ist und Abweichungen vom normalen Betrieb erkennen kann, vergehen oftmals Monate. Wenn sie bei Entdeckung eines Vorfalls auch gleich die passende Aktion starten soll, sind weiteres Training und vor allem auch umfangreiche Tests notwendig.

Thema: Künstliche Intelligenz

MW-Fotolia 102960839-square.jpg

Momentan dreht sich alles um ChatGTP. Für die Zeit davor gibt eine Einführung einen ersten Überblick über den Stand der Technologien, die Fortsetzungen skizzieren praktische Einsatzgebiete für KI, insbesondere in der Industrie. Für den Lebenslauf könnten die Ratgeber zur KI-Studienstrategie bzw. zum KI-Studium (auch in Kombination mit Robotik) sowie zum Berufsbild Machine Learning Engineer und zum KI-Manager nützlich sein.

Extrabeiträge untersuchen, wie erfolgreich Computer Computer hacken, ob und wann Vorbehalte gegen KI begründet sind und warum deshalb die Erklärbarkeit der Ergebnisse (Stichwort: Explainable AI bzw. Erklärbare KI) so wichtig ist. Hierher gehört außerdem der Seitenblick auf Maschinenethik und Münchhausen-Maschinen. Als weitere Aspekte beleuchten wir das Verhältnis von KI und Vorratsdatenspeicherung sowie die Rolle von KI in der IT-Sicherheit (KI-Security), fragen nach, wie Versicherungen mit künstlicher Intelligenz funktionieren, hören uns bei den Münchner KI-Start-ups um und sehen nach, was das AIR-Projekt in Regensburg vorhat. Ein Abstecher führt außerdem zu KI-Unternehmen in Österreich.

Auf der rein technischen Seite gibt es Berichte zu den speziellen Anforderungen an AI Storage und Speicherkonzepte bzw. generell an die IT-Infrastruktur für KI-Anwendungen. Außerdem erklären wir, was es mit AIOps auf sich hat, und im Pressezentrum des MittelstandsWiki gibt es außerdem die komplette KI-Strecke aus dem Heise-Sonderheft c’t innovate 2020 als freies PDF zum Download.

AIOps erfordert immer noch Manpower

Unternehmen, die die Einführung eines AIOps-Systems planen, müssen einen weiteren Faktor berücksichtigen, der in der ganzen Diskussion um KI-Anwendungen und ihre möglicherweise verheerenden Auswirkungen auf den Arbeitsmarkt gerne vergessen wird. Denn obwohl die Plattform unter anderem den personellen Aufwand in der IT-Abteilung verringern soll, sind für die Implementierung, das Training und die Wartung der Software andererseits auch wieder spezialisierte IT-Fachkräfte erforderlich. Aufgrund des derzeitigen Booms bei allen Themen rund um künstliche Intelligenz sind solche Spezialisten allerdings rar. Infolgedessen können sich KI-Experten vor Jobangeboten kaum retten und auch entsprechend hohe Gehaltsforderungen stellen.

Mit mir wird KI systemrelevant

Die IT-Mitarbeiter, die sich um die AIOps-Plattform kümmern sollen, müssen mehr als ein grundsätzliches Verständnis von künstlicher Intelligenz und maschinellem Lernen besitzen. Sie müssen verstehen, wie solche Systeme arbeiten, wie sie ihre Analysen durchführen und wie sie zu ihren Ergebnissen kommen. Ideal sind deshalb Fachkräfte, die bereits als Datenanalysten gearbeitet und sich möglichst auch schon professionell mit KI beschäftigt haben. Sie sollten zudem bereit und fähig sein, andere Mitarbeiter, die entsprechend geschult werden müssen, mit den Tricks und Kniffen der KI-Software vertraut zu machen. Denn die Anschaffung eines AIOps-Systems ist nur dann sinnvoll, wenn seine Möglichkeiten von allen Beteiligten erkannt und auch ausgeschöpft werden und seine Funktionalität auf diese Weise dem Unternehmen tatsächlich Vorteile bringt.

Roland-Freist.jpg

Roland Freist, Jahrgang 1962, begann nach einem Studium der Kommunikations­­wissenschaft ein Volontariat beim IWT Verlag in Vater­­stetten bei München. Anschließend wechselte er zur Zeitschrift WIN aus dem Vogel Verlag, wo er zum stell­­vertretenden Chef­­redakteur aufstieg. Seit 1999 arbeitet er als freier Autor für Computer­­zeitschriften und PR-Agenturen. Seine Spezial­­gebiete sind Security, Mobile, Internet-Technologien und Netz­­werke, mit Fokus auf Endanwender und KMU.


Redaktionsbüro Roland Freist, Fritz-Winter-Str. 3, 80807 München, Tel.: (089) 62 14 65 84, roland@freist.de

Nützliche Links