KI-Versprechen: Schalten Sie die IT auf Autopilot

Sercompe Business Technology stellt grundlegende Cloud-Services für etwa 60 Firmenkunden bereit und unterstützt insgesamt etwa 50.000 Benutzer. Daher ist es von entscheidender Bedeutung, dass die Kern-IT-Infrastruktur von Joinville, Brasilien, einen zuverlässigen Service mit vorhersehbarer hoher Leistung bietet. Aber bei einer komplexen IT-Umgebung mit mehr als 2.000 virtuellen Maschinen und 1 Petabyte – das entspricht einer Million Gigabyte – an verwalteten Daten fanden es Netzwerkadministratoren unwiderstehlich, alle Daten und Warnungen zu sortieren, um zu verstehen, was passiert, wenn Probleme auftreten. ergab sich. Und es war schwierig, die Netzwerk- und Speicherkapazität dort zu sichern, wo sie sein sollten, oder wann das nächste Upgrade durchgeführt werden sollte.

Um die Komplexität zu lösen und die Effizienz seiner Support-Ingenieure zu steigern, hat Sercompe in die Artificial Intelligence Operations Platform (AIOps) investiert, die KI nutzt, um die Ursache von Problemen zu finden und IT-Administratoren zu warnen, bevor kleine Probleme groß werden. Laut Cloud-Produktmanager Rafael Cardoso erledigt das AIOps-System heute einen Großteil der Arbeit der Verwaltung seiner IT-Infrastruktur – ein großer Vorteil gegenüber alten manuellen Methoden.

„Verstehen Sie, wenn ich mehr Platz oder Kapazität benötige – früher war es ein Durcheinander. Wir mussten Informationen von so vielen verschiedenen Punkten einholen, als wir planten. Die genaue Zahl haben wir nie bekommen“, sagt Cardoso. „Jetzt habe ich den gesamten Überblick über Infrastruktur und Visualisierung von virtuellen Maschinen bis zur letzten Festplatte in einem Rack.“ AIOps sorgt für Transparenz in der gesamten Umgebung.

Vor der Implementierung der Technologie war Cardoso ein Ort, an dem sich unzählige andere Organisationen wiederfanden: verstrickt in ein kompliziertes Netzwerk von IT-Systemen, mit Abhängigkeiten zwischen Schichten von Hardware, Virtualisierung, Middleware und schließlich Anwendungen. Jede Unterbrechung oder Ausfallzeit kann zu mühsamer manueller Fehlerbehebung und letztendlich zu negativen Auswirkungen auf das Geschäft führen: eine Website, die beispielsweise nicht funktioniert, und Kunden verärgern.

AIOps-Plattformen helfen IT-Managern, die Aufgabe der Automatisierung von IT-Abläufen zu meistern, indem sie mithilfe von KI schnelle Informationen über die Funktionsweise der Infrastruktur liefern – Bereiche, in denen es vor Staus nur so wimmelt. Der Verdienst, den Begriff AIOps im Jahr 2016 geprägt zu haben, gebührt Gartner: Es handelt sich um eine breite Kategorie von Tools, die entwickelt wurden, um die Einschränkungen herkömmlicher Tracking-Tools zu überwinden. Die Plattformen verwenden selbstlernende Algorithmen, um Routineaufgaben zu automatisieren und das Verhalten der von ihnen überwachten Systeme zu verstehen. Sie extrahieren Erkenntnisse aus Leistungsdaten, um Fehlverhalten in der IT-Infrastruktur und in Anwendungen zu erkennen und zu überwachen.

Das Marktforschungsunternehmen BCC Research schätzt, dass der globale Markt für AIOps von 3 Milliarden US-Dollar im Jahr 2021 auf 9,4 Milliarden US-Dollar im Jahr 2026 wachsen wird, mit einer jährlichen Gesamtwachstumsrate von 26 %.1 Analysten von Gartner schreiben in ihrem „Market Guide“ für AIOps vom April Plattformen „ja“ Die erhöhte Akzeptanzrate von AIOps wurde durch die digitale Geschäftstransformation und die Notwendigkeit vorangetrieben, von reaktiven Antworten auf Infrastrukturfragen zu proaktiven Maßnahmen überzugehen.

„Bei Datenmengen, die Gigabyte pro Minute auf einem Dutzend oder mehr verschiedenen Domains erreichen oder überschreiten, ist es für eine Person nicht mehr möglich, Daten manuell zu analysieren“, schreiben die Analysten von Gartner. Der systematische Einsatz künstlicher Intelligenz beschleunigt Erkenntnisse und ermöglicht Proaktivität.

Laut Mark Espositou, Director of Learning beim Automatisierungsunternehmen Nexus FrontierTech, hat sich der Begriff „AIOps“ aus „DevOps“ entwickelt – einer Software-Engineering-Kultur und -Praxis, die darauf abzielt, Softwareentwicklung und -betrieb zu integrieren. „Die Idee ist, Automatisierung und Überwachung in allen Phasen zu befürworten, von der Softwareerstellung bis zum Infrastrukturmanagement“, sagt Esposito. Zu den jüngsten Innovationen in diesem Bereich gehört der Einsatz von Predictive Analytics zur Vorhersage und Lösung von Problemen, bevor sie sich auf den IT-Betrieb auswirken können.

AIOps hilft der Infrastruktur, in den Hintergrund zu treten

Netzwerk- und IT-Administratoren, die Angst vor explodierenden Datenmengen und wachsender Komplexität haben, könnten die Hilfe gebrauchen, sagt Saurabh Kulkarni, Head of Engineering and Product Management bei Hewlett Packard Enterprise. Kulkarni arbeitet an HPE InfoSight, einer cloudbasierten AIOps-Plattform für die proaktive Verwaltung von Rechenzentrumssystemen.

„IT-Administratoren verbringen Unmengen an Zeit damit, ihre Arbeit zu planen, die Implementierung zu planen, neue Knoten hinzuzufügen, zu rechnen, zu speichern und alles andere. Und wenn in der Infrastruktur etwas schief geht, ist es extrem schwierig, diese Probleme manuell zu beheben“, sagt Kulkarni. „AIOps verwendet maschinelle Lernalgorithmen, um Muster zu betrachten, sich wiederholende Verhaltensweisen zu untersuchen und daraus zu lernen, um dem Benutzer eine schnelle Empfehlung zu geben.“ Zusätzlich zu den Speicherknoten sendet jeder Teil der IT-Infrastruktur eine separate Warnung, damit Probleme schnell behoben werden können.

Das InfoSight-System sammelt Daten von allen Geräten in der Umgebung des Benutzers und verbindet sie dann mit HPE Kundendaten aus ähnlichen IT-Umgebungen. Das System kann ein potenzielles Problem lokalisieren, sodass es schnell behoben werden kann – wenn das Problem erneut auftritt, kann die Reparatur automatisch angewendet werden. Alternativ sendet das System eine Warnung, damit IT-Teams das Problem schnell beheben können, fügt Kulkarni hinzu. Nehmen wir den Fall eines Speichercontrollers, der ausgefallen ist, weil er keinen Strom hat. Anstatt anzunehmen, dass das Problem ausschließlich mit dem Speicher zusammenhängt, untersucht die AIOps-Plattform den gesamten Infrastruktur-Stack bis hinunter zur Anwendungsschicht, um die Grundursache zu ermitteln.

„Das System überwacht die Leistung und kann Anomalien erkennen. Wir haben Algorithmen, die ständig im Hintergrund laufen, um abnormales Verhalten zu erkennen und Kunden zu warnen, bevor ein Problem auftritt“, sagt Kulkarni. Die Philosophie hinter InfoSight ist es, „die Infrastruktur verschwinden zu lassen“, indem IT-Systeme und alle Telemetriedaten in einem Glas vereint werden. Durch die Betrachtung eines riesigen Datensatzes können Administratoren schnell herausfinden, was mit der Infrastruktur nicht stimmt.

Kulkarni erinnert sich an die Schwierigkeiten bei der Verwaltung einer großen IT-Umgebung aus früheren Jobs. „Ich musste eine große Menge an Daten verwalten und so viele verschiedene Anbieter anrufen und einige Stunden warten, um zu versuchen, die Probleme herauszufinden“, sagt er. “Manchmal haben wir Tage gebraucht, um herauszufinden, was wirklich los war.”

Durch die Automatisierung der Datenerfassung und die Verwendung einer Fülle von Daten zum Verständnis der Grundursachen ermöglicht AIOps Unternehmen, Kernpersonal, einschließlich IT-Administratoren, Speicheradministratoren und Netzwerkadministratoren, neu einzusetzen, Rollen zu konsolidieren, da die Infrastruktur vereinfacht wird, und mehr Zeit für die Gewährleistung der Anwendungsleistung aufzuwenden. „Vorher hatten Unternehmen mehrere Rollen und verschiedene Abteilungen, die sich mit verschiedenen Dingen befassten. Selbst um einen neuen Speicherplatz einzurichten, mussten also fünf verschiedene Administratoren ihren individuellen Teil leisten“, sagt Kulkarni. Aber mit AIOps erledigt die KI automatisch die meiste Arbeit, sodass IT- und Support-Mitarbeiter ihre Zeit strategischeren Initiativen widmen können, die Effizienz steigern und, im Falle eines Unternehmens, das seinen Kunden technischen Support bietet, die Gewinnmargen verbessern. Beispielsweise ist es Cardoso von Sercompe gelungen, die durchschnittliche Zeit zu reduzieren, die seine Support-Ingenieure für Kundenanrufe aufwenden, was eine bessere Benutzererfahrung widerspiegelt und gleichzeitig die Effizienz steigert.

Herunterladen vollständiger Bericht.

Dieser Inhalt wurde von Insights erstellt, dem angepassten Inhalt des MIT Technology Review. Es wurde nicht von der Redaktion des MIT Technology Review geschrieben.

Leave a Comment