Upload
vuongdung
View
216
Download
0
Embed Size (px)
Citation preview
APA – Online Manager
IT-Subsidiary of a News Agency as a Profit Center
Manfred Mitterholzer Rudolf Horvath
Das Unternehmen
APA – Gruppe240 Mitarbeiter34,6 Mio Umsatz
APA - IT100 % Tochter der Austria Presse Agentur seit 1.1.200255 MitarbeiterUmsatz EUR 9,5 Mio
GF III - Informationstechnologie
Dienstleistungen für externe Kunden
Applikationsentwicklung und Portallösungen (CMS)
Outsourcing Produkte
Redaktion-Systeme RadioTV-Stationen
Datenbank-Hosting
AOM – APA OnlineManager
Applikationsentwicklung, Portallösungen (CMS)
•Trennung von Content und Darstellung•Workflow und Berechtigungssystem•Plattformunabhängigkeit •Beliebige Skalierbarkeit
Redaktions-Clientfür Erstellung von Inhalten
Publikations-Enginepubliziert freigegebene Inhalte
Presentation-Enginestellt die Inhalte mittels Templates dar
Outsourcing ProdukteAll inklusiv Betreuung Server, Desktop7 x 24h APA-IT Techniker vor OrtSpezialist für große DatenmengenBewältigung rasch auftretender Spitzen (Wahlen, 9/11, EM/WM)Breitbandiges Internet 2 x 1 Gbit
USV, Dieselaggregat, Klima redundant
50% aller ÖWA-Visits bei APA-IT
Zufriedenen Kunden aus Medien, Politik und Wirtschaft
Spiegelung in Ausfall-RZ seit 3/2005
Sendungs-Planung, Abwicklung•Alle ZiBs, TV-Magazine, Landesstudios•Alle Hörfunk-Nachrichten, Journale•2.500 Anwender in ORF-Redaktionen•83.000 Sendungen pro Jahr
APA-IT Video Server•Aufnahme,Speicherung eines TV-Signals•Videoschnitt am Redakteursarbeitsplatz•Parallele Aufnahmen und Videoschnitt
Der APA DatenbankhostGrößter Datenbank-Host in Österreich8.000 registrierte Benutzer1.600 zur Spitzenzeit online50 Millionen Dokumente
Täglich 60.000 neue Dokumente in Real Time20 Mio. Suchen pro Jahr40 Mio. Dokumentenabrufe
Der APA Datenbankhost250+ multimediale Quellen:
Text, Bilder, Business Grafiken, Audios, VideosZeitungen, Agenturen, Business Info, TermineAlle österr. Tageszeitungen seit 1990Alle wichtigen österr. Wochen-, MonatszeitungenDie großen deutschen Tages- u. WochenzeitungenHistorisches Archiv (Scan,OCR) APA-Basisienstseit 1955
Der APA-OnlineManager (AOM)Zugriff auf APA-Datenbankhost und Onlinedienstleistungen der APA
Windows-ClientWebbasierte HTML-ApplikationPDA-VersionSMS-Versand der Titel
Kombinierte Volltextrecherche in Archiv und hochaktuellen Real Time-Nachrichten
APA-OnlineManager internationalAOM eine rein österreichische Entwicklung erweckt internationales InteresseSeit Dezember 2004 Im ASP Betrieb auf Servern in Wien für dpa – Deutsche Presse Agentur14 Mio Dokumente, alle dpa Meldungen seit 1982700 dpa-user in allen deutschen Großstädten und Korrespondenten in der ganzen Welt haben ZugriffGespräche über ähnliche Lösungen mit skandinavischen Zeitungsverlagen und Nachrichtenagenturen
AOM – InnovationsprojektDie Ausgangssituation
Steigende Anzahl von Dokumenten und Quellen am APA-DatenbankhostZunehmende Schwierigkeiten für die Benutzer relevante Dokumente zu findenLange Antwortenzeiten bei umfangreichen RecherchenSuchmaschinen im Internet geben Standards hinsichtlich der Response Time vorNeuere Methoden aus dem Bereich Wissensmanagement praktikabel umsetzbar
AOM – InnovationsprojektDie Umsetzung
Phase 1: APA-IT PowerSearchBeschleunigtes RetrievalLeistungsfähiger Unterbau für Phase 2
Phase 2: Angewandtes Knowledge ManagementZiel ist effektive Unterstützung der User um zu relevanteren Suchergebnissen zu gelangenTopic ClusteringSimilarity SearchVisualisierung von SuchergebnissenAkzeptable Antwortzeiten erforderlich
APA-IT PowerSearch - MotivationSchnelles Fulltext-Retrieval erforderlich für:
Umfangreiche RecherchenGeplante neue AOM-Funktionen
„Altes“ Volltextsystem zu langsam für AnforderungenIm Test keine klaren Vorteile der Mitbewerbsprodukte unter APA-Rahmenbedingungen
52 Mio. Quellen, 250+ Quellen, 1500 gleichzeitige UserEigenentwicklung einer Volltext-Engine durch APA-IT in 2003APA-IT PowerSearch integriert in AOM-Version 5.0
In Produktion seit September 2004
PowerSearch – Key FeaturesSchnellere, verbesserte Recherche
Typische Suche in 52 Mio. Dok. dauert nur wenige Sek.Schneller Dokumentenabruf und schnelle SortierungKnowledge Management-Funktionen direkt im KernelUnveränderte Suchoptionen für die Benutzer
Boolesche VerknüpfungenWildcardsSucheinschränkung auf Dokumentenfelder
Unscharfe Suche (Gaddafi, Gadaffi, Gadhaffi, …)Alternative Suchsyntax, zusätzliche RetrievaloperatorenHochgradig skalierbar und fehlertolerant, …
Topic ClusteringIst – Situation für den Benutzer:
Flache Ergebnislisten sind unübersichtlichLangwieriges Blättern liefert nur groben Überblick
Topic ClusteringTeilt ein Suchergebnis in Gruppen von thematisch verwandten DokumentenVergibt aussagekräftige Beschreibungen an Gruppen
Themen ClusteringVorteile
Im Suchergebnis verborgenes Wissen wird unmittelbar sichtbarRelevante Themengruppen direkt navigierbar
Cluster werden „On The Fly“ aus den VolltextenerrechnetKein zugrunde liegendes KategorienschemaGroße Cluster in sich wiederum gruppierbarEigenentwicklung der APA-ITDurchsatz ca. 1.000 Dokumente pro Sekunde
Clustering - BeispielSuche nach „WWF“ in APA-Meldungen seit 1986 bringt 2986 Treffer
Clustering - ListeIdentifizierte Themen:
Clustering: APA+OTS 4.4. – 7.4.
Similarity SearchFindet Dokumente, die zum aktuellen Dokument
thematisch ähnlich sindweiterführende Informationen enthalten
Keine Formulierung von Suchbegriffen nötig
Die Suche ist das aktuelle Dokument selbst
Trefferliste nach Relevanz sortiert
Relevante Wörter des Basisdokuments in den Treffern hervorgehoben
Optimiertes TF / IDF – Verfahren als technische Grundlage, direkt in APA-IT PowerSearch integriert
Suchergebnis Visualisierung„Ein Bild sagt mehr als 1000 Worte“
Zusätzliche Navigation in Suchergebnissen
Mögliche Freiheitsgrade der Darstellung sind:Ähnlichkeit von DokumentenÄhnlichkeit von Themen ClusternZeitachseWorthäufigkeitenQuellen
ZeitreihenSuche nach „Internet“ im APA-Basisdienst seit 1986
Visualisierung Hügel
Visualisierung Spinne
Visualisierung 3D-Hügel
QuellenchartsSuchbegriff „Harmonisierung“ Suchbegriff „Forschung“
APA-OnlineManager - ZeitplanAOM 5.0
Schnelle Recherche über großen DatenbestandIn Produktion seit September 2004
AOM 6.0Themen Clustering, Ähnlichkeitssuche, Visualisierung, neues GUIUmsetzung der KM-Funktionen technisch fertigAOM-Windows-Client in FertigstellungFreigabe erfolgt Mai 2005