Fehlersuche auf IBM-Mainframes: Was die Fehler­suche auf z/OS-Rechnern leichter macht

Administratoren in Groß­unter­nehmen wissen, wie zeit­auf­wendig die Ar­beit mit Oper­log ist. Oper­log-Daten lie­gen ent­weder aktuell (online) vor oder sie sind ar­chi­viert. Auf beide Quellen muss der Ad­ministra­tor zugreifen, wenn er die Ur­sachen für Fehler oder Pro­ble­me im z/OS-Umfeld nach­voll­ziehen will.

Zugleich Zugriff auf Archiv und Logstream

Von Thomas Große Osterhues, Beta Systems DCI Software

In z/OS-Umgebungen eines Rechenzentrums entstehen bei großen Unternehmen Tag für Tag Millionen von Meldungen, von Benutzeranmeldungen bis zu Hinweisen auf kritische Fehler. Operlog-Daten als spezielles Logstream-Format spielen hier eine besondere Rolle. Damit werden Kommunikationen über Programme und Systemfunktionen von jedem System in einem Sysplex aufgezeichnet und zusammenführt. IBM empfiehlt JES3-Kunden mit einem Multisystem-Systemkomplex die Verwendung von Operlog-Logstream, gleichzeitig sollten JES3 DLOG und SYSLOG ausgeschaltet werden. Operlog kann auch als reiner DASD-Protokollstrom verwendet werden.

Die Arbeit mit diesem speziellen Format ist nun alles andere als trivial, sie erfordert viel Zeit und Know-how – auch weil sie mit aktuellen und archivierten Daten geschieht. Für jede Zugriffsart sind üblicherweise verschiedene Systeme notwendig: zum einen die IBM-eigene System Display and Search Facility (SDSF) – oder ein ähnliches Produkt – für aktuelle Daten sowie zum anderen ein Archivsystem für die abgelegten Daten. Das bedeutet stets: zwei verschiedene Oberflächen, voneinander abweichende Kommandostrukturen, die zu beachten sind, ergo Zeit- und Arbeitsmehraufwand für den Administrator, der sich in unterschiedliche Systeme einarbeiten muss.

Handarbeit blockiert Ressourcen

Dass es auch anders geht, zeigt das Beispiel Credit Suisse. Dort setzt man seit einiger Zeit ein Werkzeug ein, das beide Ansätze vereint. Es verwaltet sowohl den Online- wie den archivierten Bestand über eine gemeinsame Oberfläche. Der Admin kann Meldungen einzeln aussortieren, sie selektieren, bisherige Selektionskriterien sichern und wiederverwenden usw. Vergleichbare Werkzeuge wurden von der IBM-Community in der Vergangenheit nur schlecht angenommen. Anwender sind vor allem Großunternehmen, die traditionell mit IBM-Infrastrukturen arbeiten: Versicherungen, Banken, Krankenkassen und auch Behörden.

Rechenzentren 2018-04.jpg

Schwarz auf Weiß
Dieser Beitrag erschien zuerst in unserer Magazin­reihe „Rechen­zentren und Infra­struktur“. Einen Über­blick mit freien Down­load-Links zu sämt­lichen Einzel­heften bekommen Sie online im Presse­zentrum des MittelstandsWiki.

Bislang mussten die RZ-Administratoren der Credit Suisse Fehler im Produktionsbetrieb stets manuell aufspüren. Dies hatte mühsame und zeitraubende Suchen zur Folge, gerade in kritischen Situationen mit hoher Management Attention, in denen Fehler auftraten, die zum Stopp der IT-Produktion führten und innerhalb kürzester Zeit behoben werden mussten. Das führte zudem nicht selten zur Blockade von Ressourcen, die dann nicht für andere Zwecke verwendet werden konnten.

Rund 100 User arbeiten bei dem Finanzdienstleister heute mit der neuen Lösung Operlog Tools von Beta Systems. Sie besteht aus drei Komponenten: Logstream Manager, Operlog Manager und Sysplex Communicator.

What are Operlog Tools. Abb. Beta Systems.JPG
Operlog Tools in der Übersicht (Bild: Beta Systems DCI Software)

Der Logstream Manager als Basistool soll Systemprogrammierern die Auswahl von Logstreams erleichtern und bei Sortierung, Anzeige der Definition und Einstellungen, Klonen eines oder mehrerer Streams etc. unterstützen. Der Operlog Manager bietet Hilfestellung bei der Handhabung von Operlog-/Syslog-Daten – eine Arbeit, für die sonst zwei separate Tools für aktuelle und Archivdaten notwendig wären. Er ermöglicht einen individuellen Zugriff auf die z/OS-Operlog-Funktion. Unterstützt werden TSO/ISPF und Batch-Zugriffe. Über die Batch-Schnittstelle können Operlog-Daten im Hintergrund ausgewählt sowie im SYSLOG- und/oder MDB-Format (Nachrichtendatenblock) gespeichert werden. Die gespeicherten Daten sind über einen vom Kunden gewählten Zeitraum mit der gleichen Schnittstelle und Ausstattung verfügbar. Der Zugriff auf Operlog kann über SAF-Definitionen gesteuert und systembezogen festgelegt werden. Für die Kommunikation mit Sysplex greift der Logstream Manager auf die offene Basic-Sysplex-Schnittstelle (XCF) zurück.

Thomas-Grosse-Osterhues.jpg

Thomas Große Osterhues ist Senior Manager Product Marketing der Beta-Systems-Tochter Beta Systems DCI Software AG in Berlin, die auf Produkte und Lösungen für Rechenzentren spezialisiert ist. Besonderes Augenmerk liegt dabei auf schnellen Support und umfassender RZ-Betriebssicherheit. Mit den Operlog Tools hat das Unternehmen auch ein Werkzeugset für die Online-Verwaltung von Logstreams und die vollumfängliche Auswertung von Operlog-Daten im Portfolio.


Beta Systems DCI Software AG, Alt-Moabit 90d, 10559 Berlin, Tel.: 030-726118-640, info-iam@betasystems.com, www.betasystems-dci.com

Praxisbeispiel Credit Suisse

Die Credit Suisse Group AG hat dadurch die Fehlersuche in ihrer IT-Produktion stark vereinfacht. Risiken ungewollter Ausfälle wurden minimiert, ebenso die Zeit für die Fehlereingrenzung. Dies funktioniert über flexible Suchmöglichkeiten. In den meisten Fällen sind bei Problemanalysen zwar einzelne verdächtige oder kritische Nachrichten, Nachrichtenteile oder Jobs bekannt. Oft ist es jedoch auch wichtig zu wissen, welche Meldungen unmittelbar vor oder nach einem Ereignis geschrieben wurden. Der Benutzer kann in dem Tool daher einen Zeitraum in Sekunden angeben, für den Meldungen vor oder nach Ereignissen angezeigt werden.

Wichtig sind zudem Selektionskriterien: dass der Admin Jobs nach Datum, Zeit, Systemname, Jobname, Job-ID, Nachrichten-ID sowie Text filtern kann. Das Abspeichern einmal verwendeter Filtereinstellungen und ihre Wiederverwendung erleichtern die Fehlersuche ebenfalls. So muss man nicht stets von vorn anfangen. Wert legt Credit Suisse ferner auf Übersichtlichkeit. Das Anzeigen oder Ausblenden ausgewählter Nachrichten, Nachrichtenarten oder Systemnamen, die Einblendung von Befehlen nur bestimmter Konsolen oder die Trennung mehrzeiliger Nachrichten sind Möglichkeiten, welche die Fehlersuche deutlich vereinfachen.

Nützliche Links