Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
Herzlich Willkommen bei der Abschlusspräsentation der
Diplomarbeit vonMarcus Eichler
Korrelation von automatisierten Servicekontakten (Events) im Rahmen des Dienstleistungsangebotes Application Service Providing der DATEV im BereichLeitungsüberwachung und Erstellung eines Prototypen
Aufgabensteller Prof. Dr. A. DeinzerArbeit vorgelegt am 16.02.2004
durchgeführt bei Fa. DATEV eG, Paumgartnerstraße 6-14Design & Technik IT-Management
Betreuer Stefan Nepf Dipl.-Betriebswirt (FH) Michael Schellenberger
Anschrift Marcus EichlerNeumarkterstr. 3490559 Burgthann
P633 Marcus Eichler 17.09.2003 Dok: #31225 3
Teilnehmer
• Prof. Dr. Arnulf Deinzer (FH-Kempten)
• Michael Beer (DATEV)
• Stefan Nepf (DATEV)
• Marcus Eichler (FH-Kempten)
P633 Marcus Eichler 17.09.2003 Dok: #31225 4
Agenda
1. Motivation
2. Analyse (Leitung)
3. Konzept
4. Implementation
5. Test
6. Resümee
P633 Marcus Eichler 17.09.2003 Dok: #31225 5
Warum?
??
?
„Ich kann nicht arbeiten“
Wir helfen unseren Kunden!
Analyse Konzept Implementierung Test ResümeeMotivation
P633 Marcus Eichler 17.09.2003 Dok: #31225 6
Wie?
Fehler erkennen
Fehler beheben
Fehler vermeiden
Analyse Konzept Implementierung Test ResümeeMotivation
P633 Marcus Eichler 17.09.2003 Dok: #31225 7
Was ist nötig?
Wer Fehler erkennen, beheben und vermeiden will, muss:
- die Systeme des Kunden kennen
- diese dokumentieren
- die Systeme so konfigurieren, damit Fehler vermieden werden
- prüfen, ob die Systeme optimal laufen
- prüfen, ob die Systeme noch funktionieren
ständig
ständig
ständig
ständig
ständig
Manuell NICHT möglich!
Analyse Konzept Implementierung Test ResümeeMotivation
P633 Marcus Eichler 17.09.2003 Dok: #31225 8
Komplexität / Größe
- 1121 administrierte Server
Kanzlei
- 309 betreute Kanzleien
- 3902 verwaltete Clients
Analyse Konzept Implementierung Test ResümeeMotivation
Geschäftsbereich IT-Management
(Stand: Januar 2004)
P633 Marcus Eichler 17.09.2003 Dok: #31225 9
Leistungsumfang des IT Management
•Datensicherung
•Virenschutz
•Wartung der Systeme
•Systemmanagement
•Lizenzmanagement
•Administration
•Problemmanagement
•Änderungsmanagement
•Teamservice für produkt-übergreifende Unterstützung
•Hotline
Notwendig: Automatisierung von Serviceprozessen
Analyse Konzept Implementierung Test ResümeeMotivation
P633 Marcus Eichler 17.09.2003 Dok: #31225 10
Problem des automatisierten „Monitorings“
ca. 135.000 Meldungen im Monat(Stand: Dezember 2003)
Meldung
Meldung
Meldung
Korrelation von automatisierten Servicekontakten
Analyse Konzept Implementierung Test ResümeeMotivation
Notwendig:
P633 Marcus Eichler 17.09.2003 Dok: #31225 11
Netzwerkstruktur
Abbildung : DATEVasp – Die technische Infrastruktur aus den Schulungsunterlagen Doc#: 29643
Analyse Konzept Implementierung Test ResümeeMotivation
P633 Marcus Eichler 17.09.2003 Dok: #31225 12
Ablauf
• Automatische Überwachung aller Systeme
• Meldung an eine zentrale Empfangsstation
• Verarbeitung der Meldung
Analyse Konzept Implementierung Test ResümeeMotivation
P633 Marcus Eichler 17.09.2003 Dok: #31225 13
Agent 1
Kanzleisysteme
Agent 2
Agent …
Service Center
Überwachen Empfangen Speichern Verdichten Ticket
Datenbank Filter / Korrelation
Meldungs-empfänger
Verarbeitungsprozess
Analyse Konzept Implementierung Test ResümeeMotivation
P633 Marcus Eichler 17.09.2003 Dok: #31225 14
• Rule based Systems
• Model based Systems
• Case based Systems
Verschiedene Ansätze
Analyse Konzept Implementierung Test ResümeeMotivation
• Dependency Graph
• Neural Network
P633 Marcus Eichler 17.09.2003 Dok: #31225 15
Erst bei mehreren Hinweisen auf einen Vorfall wird ein Ticket erzeugtLösungsansatz: Neural Network
Neuron (Knoten)
Analyse Konzept Implementierung Test ResümeeMotivation
P633 Marcus Eichler 17.09.2003 Dok: #31225 16
1. „NewOID“
2. „Prozent“
3. „ZeitinMin“
4. „Bezeichnung“
Notwendige Parameter
Neuron (Knoten)
Gewichtung
Überwachungszeitraum
Analyse Konzept Implementierung Test ResümeeMotivation
Information
P633 Marcus Eichler 17.09.2003 Dok: #31225 17
Zeit
T0
Zeit in Minuten
T-1
Überwachungszeitraum
„ZeitinMin“ = Überwachungszeitraum
Überwachungszeitraum
Analyse Konzept Implementierung Test ResümeeMotivation
P633 Marcus Eichler 17.09.2003 Dok: #31225 18
Der Korrelator hat Auffälligkeiten in…. entdeckt C-1234
UUID
Verlust eines ICMP-Packetes abcd C-1234
Datei konnte nicht gelesen werden efgh C-1234
Antwortzeit des Routers zu groß ijkl C-1234
mnop C-1234
ParentUUIDUUID
Neue Meldung
Eingangssignale
Kopieren
Verlust eines ICMP-Packetes
Verknüpfung der Meldungen
Analyse Konzept Implementierung Test ResümeeMotivation
P633 Marcus Eichler 17.09.2003 Dok: #31225 19
C-6F9619FF-8B86-D011-B42D-00C04FC964FF-10.162.9.1
C für CorrelatorSystemerzeugte IDIP- Adresse
Erzeugung einer UUID
Analyse Konzept Implementierung Test ResümeeMotivation
P633 Marcus Eichler 17.09.2003 Dok: #31225 20
1. Vorbereitungen (Meldung des Agenten eindeutig machen)
2. Abfragealgorithmus entwickeln
3. Anpassungen am Troubleticketsystem
ToDo
Analyse Konzept Implementierung Test ResümeeMotivation
P633 Marcus Eichler 17.09.2003 Dok: #31225 21
Meldungen eindeutig machen (Beispiel Cricket)
Schwellwert überschritten (OID1)
Schwellwert überschritten
Schwellwert überschritten (OID1)
Analyse Konzept Implementierung Test ResümeeMotivation
Vorher Nachher
CPU ausgelastet(OID1)
Bandbreite überschritten(OID 2)
P633 Marcus Eichler 17.09.2003 Dok: #31225 22
Abfragealgorithmus entwickeln (gespeicherte Prozedur)
Eingabe AusgabeVerarbeitung
Analyse Konzept Implementierung Test ResümeeMotivation
Einlesen Suchmuster ermitteln
Scannen Berechnen Ausgeben
P633 Marcus Eichler 17.09.2003 Dok: #31225 23
Das Troubleticketsystem anpassen
Array aller UUID´sUUID1
UUID2
UUID3
…
Analyse Konzept Implementierung Test ResümeeMotivation
P633 Marcus Eichler 17.09.2003 Dok: #31225 24
Funktionstest / Stresstest
Analyse Konzept Implementierung Test ResümeeMotivation
• Funktionstest
Mustererkennung und Verknüpfung
Weiterleitung der Meldungen
• Stresstest
Erhöhung der Anzahl zu korrelierender Meldungen
Erhöhung des Überwachungszeitraumes
P633 Marcus Eichler 17.09.2003 Dok: #31225 25
Funktionstest
Analyse Konzept Implementierung Test ResümeeMotivation
Durch den Korrelator erstelltes Problemticket
P633 Marcus Eichler 17.09.2003 Dok: #31225 26
Erhöhung der Anzahl zu korrelierenden Meldungen
Laufzeit der Prozedur SP_OpenView bei sukzessiver Erhöhung der zu verarbeitenden Meldungen
(Überwachungszeitraum = 60 min)
0,00
2,00
4,00
6,00
8,00
10,00
12,00
0 1 2 3 4 5 6 7 8 9
Meldungen
Zeit in s
Analyse Konzept Implementierung Test ResümeeMotivation
Ergebnis: Bei Täglich ca. 3500 Meldungen, reicht Performance aus
P633 Marcus Eichler 17.09.2003 Dok: #31225 27
Laufzeit der Prozedur SP_OpenView bei sukzessiver erhöhung des Überwachungszeitraumes
0
2
4
6
8
10
12
14
16
18
20
60 120180
240300
360500
10001500
20002500
10000100000
Überwachungszeitraum in Minuten
Zeit in S
Erhöhung des Überwachungszeitraumes
Analyse Konzept Implementierung Test ResümeeMotivation
Ergebnis: Korrelationen über mehrere Tage sind möglich
P633 Marcus Eichler 17.09.2003 Dok: #31225 28
Beispiel (Leitungsüberwachung)
ASP-Verbindung10060.1.3.6.1.4.1.3744.3.1.11710NSM_Interface_Ethernet_überschritten
ASP-Verbindung10060.1.3.6.1.4.1.3744.3.1.11710NSMAliveNichtErreichbarShare
ASP-Verbindung10060.1.3.6.1.4.1.3744.3.1.11710NSMAliveNichtErreichbar
ASP-Verbindung1060.1.3.6.1.4.1.3744.3.1.11710NSMAliveWiederErreichbar
ASP-Verbindung3560.1.3.6.1.4.1.3744.3.1.11710NSMAliveOKPingFehler
ASP-Verbindung3560.1.3.6.1.4.1.3744.3.1.11710NSMAliveOKPingTeilweise
ASP-Verbindung3560.1.3.6.1.4.1.3744.3.1.11710NSMPingTeilweiseErreichbar
ASP-Verbindung1060.1.3.6.1.4.1.3744.3.1.11710NSMPingWiederErreichbar
ASP-Verbindung3560.1.3.6.1.4.1.3744.3.1.11710NSMPingNichtErreichbar
BezeichnungProzentZeit/Min
NewOIDTrapname
Resultat in 24 std. Korrelationsfaktor hier 18 : 1
Analyse Konzept Implementierung Test ResümeeMotivation
P633 Marcus Eichler 17.09.2003 Dok: #31225 29
Verringerung der Ticketanzahlen
Reduzieren des Aufwandes
Überblick bewahren
Hinweise behalten (Analyse möglich)
Resümee
Analyse Konzept Implementierung Test ResümeeMotivation
P633 Marcus Eichler 17.09.2003 Dok: #31225 30
• Fragen?
Fragen?
Vielen Dank für Ihre Aufmerksamkeit
Marcus Eichler