12
IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. 11.10.2011 Kollaborative Korrektur Doris Škarić, Bayerische Staatsbibliothek, Münchener Digitalisierungszentrum/Digitale Bibliothek

BSB Demo Day - Skaric - Kollaborative Korrektur

Embed Size (px)

DESCRIPTION

 

Citation preview

Page 1: BSB Demo Day - Skaric - Kollaborative Korrektur

IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

11.10.2011

Kollaborative Korrektur Doris Škarić, Bayerische Staatsbibliothek, Münchener Digitalisierungszentrum/Digitale Bibliothek

Page 2: BSB Demo Day - Skaric - Kollaborative Korrektur

11.10.2011

IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

2

Agenda

� Definition

� State-of-the-Art

� IMPACT-Tool zur Kollaborativen Korrektur

– Demonstration des CONCERT-Tools

– Erfahrungsbericht

– Nutzen für Bibliotheken

Page 3: BSB Demo Day - Skaric - Kollaborative Korrektur

11.10.2011

IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

3

Was ist kollaborative Korrektur?

� Kollaborativ: mehrere Personen arbeiten gemeinsam an einem Projekt, hier:

Textkorrekturen

� Crowdsourcing: “kollaborative Leistungserbringung durch Freiwillige”

� Reihenfolge im Digitalisierungsprozess: nach automatischer Texterkennung

Page 4: BSB Demo Day - Skaric - Kollaborative Korrektur

11.10.2011

IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

4

Wieso Textkorrekturen?

� V.a. bei historischen Material (keine normierte Rechtschreibung…) führt alleinige

Anwendung von OCR-Software zu oft nicht ausreichender Erkennungsrate

� Fehlerhafte Erkennung von Fraktur, z.B. langes s wird als f erkannt, z.B. Bifchof,

Befatzungen…

� einzelne fehlerhafte Buchstaben führen zu schlechter Worterkennung

� Buchstaben, „Signal-“wörter werden nicht erkannt

Page 5: BSB Demo Day - Skaric - Kollaborative Korrektur

11.10.2011

IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

5

Andere Systeme zur kollaborativen Korrektur

� Australian Newspaper Digitisation

Program

� ReCaptcha

� Mole Hunt

Page 6: BSB Demo Day - Skaric - Kollaborative Korrektur

11.10.2011

IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

6

IMPACT-Beitrag

� CONCERT

– Collaborative eNgine for the CorREction of Texts

– Web-basierte Plattform

– Geeignet für massenhafte Beteiligung von Freiweilligen (Crowdsourcing)

– Ergebnisse der Korrektur werden in den OCR-Prozess eingespeist („Adaptive OCR“)

– Korrektur auf drei Ebenen

– schnelle und effiziente Arbeitsweise

Page 7: BSB Demo Day - Skaric - Kollaborative Korrektur

11.10.2011

IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

7

Funktionsweise

� https://bsbimpact2.bsb.lrz.de:8443/impact

/Concert/Concert-Final.html

Page 8: BSB Demo Day - Skaric - Kollaborative Korrektur

11.10.2011

IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

8

Pilotphase an der BSB

� 1-wöchiger Test mit ca. 15 Teilnehmern

� Fragestellungen:

– Usability

– Annahme durch Nutzer

– Erkennungsergebnisse

– Einbindung in Digitalisierungsprozess

Page 9: BSB Demo Day - Skaric - Kollaborative Korrektur

11.10.2011

IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

9

Nutzereindrücke

� Insgesamt sehr positiv

� Nutzerwünsche:

mehr „Nutzermotivation“ und Rückmeldung

� Fortschrittsanzeige, Vergleich mit anderen Freiwilligen

� manche Wörter werden von der Texterkennung falsch erkannt und dadurch nie zur

manuellen Korrektur vorgelegt bzw. als fragwürdig erkannt

� Gothic und Antiqua in einem Text werden nicht erkannt

� mehr Metadaten für Bücher

Page 10: BSB Demo Day - Skaric - Kollaborative Korrektur

11.10.2011

IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

10

Einsatzmöglichkeit für die Bibliotheken

� Verbesserung der Volltexte durch Nutzerbeteiligung

� Ermöglichung zeitintensiver Korrekturen

� schnellere Korrekturen (durch Bibliotheksnutzer oder Dienstleister)

� „Kundenbindung“

� Verknüpfung des Katalogtitels mit der Korrektursoftware, z.B.: helfen Sie uns den

Volltext dieses Buchs zu verbessern

Page 11: BSB Demo Day - Skaric - Kollaborative Korrektur

11.10.2011

IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

11

Ausblick :

� Verbesserung des Bedienkomforts

� User Monitoring

� Motivierung der Nutzer

� Einbindung in Texterkennungs- und Bearbeitungsprozess

� Langzeitarchivierung

Page 12: BSB Demo Day - Skaric - Kollaborative Korrektur

11.10.2011

IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.

12

Vielen Dank für Ihre Aufmerksamkeit

Kontakt: [email protected]