Kurzvorstellung "KUG Recherche-Infrastruktur"

Preview:

Citation preview

Universität zu Köln

Der Kölner UniversitätsGesamtkatalog

Kurzvorstellung'KUG Recherche-Infrastruktur'

Oliver Flimm <flimm@ub.uni-koeln.de>

Uni-IT13.6.2016

Universität zu Köln

„Der KUG“• Zentrale Recherche-Infrastruktur für

die Bestände der Universität zu Köln• Umfang (Stand 6/2016): 22.05 Mio.

Titel / 323 Kataloge / 348 Views• Integriert verschiedene Prinzipien und

Funktionen aus dem Social- und Semantic Web

• Realisiert mit der Open-Source Software OpenBib (GPL, seit 1997)

Universität zu Köln

Universität zu Köln

Besonderheiten• Eigenentwicklung unter GPL• Open Source als zentrales Prinzip

– Softwareverteilung über öffentliches Git Repository (Github)

• Eine Infrastruktur für effiziente Bereitstellung vieler separater Portale– Objektorientiertes Templating (Spezialisierung

nach Datenbank, View und Katalogprofil)

Universität zu Köln

Universität zu Köln

Universität zu Köln

Umgebung• LPPX (Linux, PSGI, PostgreSQL, Xapian)

– Debian 8.5 „Jessie“– PSGI mit starman– PostgreSQL 9.4– Xapian 1.2.19– CGI::Application(::Dispatch)– Template-Toolkit– jQuery– YAML 4

Universität zu Köln

Einige Zahlen• Perl-Skripte: 698• Perl-Module: 278• Perl-Code: 89.092 Zeilen (openhub.net)• Templates: 1752• CSS: 288

Universität zu Köln

KUG Infrastruktur: Ziele• Eine Lösung für

– Endnutzer im Web-Browser– Integration in andere Dienste (USB-Portal)– Semantic Web

• Durchgehender 24/7 Betrieb– Möglichst keine Downtimes bei

Erweiterungen/Updates

• Größtmögliche Flexibilität und Erweiterbarkeit

Universität zu Köln

KUG Infrastruktur: Zentrale Prinzipien

• Trennung von Ressourcen und verschiedenen Repräsentationen– Content-/Language-Negotiation per Redirect– HTML, JSON, RDF, RSS, CSV, TXT, ICAL

• REST für einzelne Ressourcen (JSON)– GET, POST, PUT, DELETE– „getunnelt“ über Web-Interface

Universität zu Köln

Beispiel: URI's

Ressource: – /portal/<view>/databases (GET,POST)

Repräsentationen:– /portal/<view>/databases.html?l=de– /portal/<view>/databases.json?l=de– /portal/<view>/admin/databases.html?l=de– /portal/<view>/admin/databases.json?l=de

Universität zu Köln

Beispiel: URI's II

Ressource: – /portal/<view>/databases/id/mdz

(GET,PUT,DELETE)

Repräsentationen:– /portal/<view>/databases/id/mdz.html?l=de– /portal/<view>/databases/id/mdz.json?l=de– /portal/<view>/admin/databases/id/mdz.html?l=de– /portal/<view>/admin/databases/id/mdz.json?l=de

Universität zu Köln

Beispiel: URI's III{ "databases": [ {

"id": "alff", "description": "Sammlung Alff", "active": 1, "sigel": "38-alff", "url": "http://www.ub.uni-koeln.de/cdm4/browse.php?CISOROOT=/alff", "system": "Sisis", "link": { "rel": "self", "href": "http://kug.ub.uni-koeln.de/portal/kug/databases/id/alff.json?l=de" }, "dbname": "alff" },… ]}

Universität zu Köln

USB-Portal KUG

S1 S2 S3 S4

Frontend S0

Cluster A

System /Statistik DB

Cluster B

HaProxy

Recherche Update

Architektur für 24/7

Universität zu Köln

Aggregation externer Daten als Kataloge

• Standardisierter Import-Workflow (Plugins)• Standard-Schnittstellen (OAI) und Formate

(DC, MAB, MARC21), sonst API (OER) und/oder eigene Konverter

• Zentrale OAI-Aggregation mit REPOX• Nutzung von Open Data (BVB, SWB, hbz)

– Beispiel: Nomos Online Premium

Universität zu Köln

Universität zu Köln

Anreicherungen

– Medientypen, Sprachen (automatisiert)– RVK, DDC, Schlagworte, Links auf

Inhaltsverzeichnisse aus Open Data Dumps– Verschlankung verschiedener Systematiken

zu 20 Themengebieten über Konkordanzen- 370.000 Titel mit BK vs. 1.1 Mio Titel mit

Themengebiet

– Referenzierende Artikelnamen aus der Wikipedia als 'Schlagworte'

Universität zu Köln

Administration

• Grundlegende Administration muss an Nicht-Techniker delegierbar sein– Web-Oberfläche für Administratoren

• Gleiches gilt für die textuelle Betreuung von Sammlungsportalen durch externe Wissenschaftler (Präsentation von Forschungsdaten)

Universität zu Köln

Universität zu Köln

Universität zu Köln

Sonstiges

• Dienste aus der Infrastruktur– Bibliotheksführer– Zeitschriftenlisten der Institute– Bestandsabgleich– Katalog als CSV-Datei– Teilbestände als eigener Katalog– Export von Provenienzen als Open Data– Warenkorbsysteme in der Erwerbung

Universität zu Köln

Fragen?

Universität zu Köln

Vielen Dank für Ihre Aufmerksamkeit

Quellen:KUG - http://kug.ub.uni-koeln.de/

OpenBib - http://www.openbib.org/

OpenBib Wiki - http://wiki.openbib.org/

OpenBibBlog - http://blog.openbib.org/

Projektseite – https://github.com/oflimm/openbib/

Xapian Suchmaschine - http://www.xapian.org/