Sprachdienstleister-Workshop ... Art Mأœ-System Ansatz Ergebnis Vorteile Nachteile Grundlage Regelbasierte

  • View
    0

  • Download
    0

Embed Size (px)

Text of Sprachdienstleister-Workshop ... Art Mأœ-System Ansatz Ergebnis Vorteile Nachteile Grundlage...

  • Sprachdienstleister-Workshop Fachtag der gewerblichen Dienstleister

    im „Schloss an der Eisenstraße“

    GEMEINSAM MEHR ERREICHEN!

  • Barbara Heinisch „Digitalisierung und maschinelle

    Übersetzung (MÜ)“

    GEMEINSAM MEHR ERREICHEN!

  • Maschinelle Übersetzung

  • Überblick

    • Einführung (Arten von MÜ, Sprachressourcen, Training)

    • Datenschutz, Datensicherheit, Vertraulichkeit

    • Pre-Editing, Post-Editing und kontrollierte Sprache

    • Qualität, Evaluation und Fehlermetriken

    • Verrechnung

    • Abschluss

  • Nutzen Sie maschinelle Übersetzung (MÜ)?

    Welche MÜ-Systeme nutzen Sie?

    Welche MÜ-Systeme kennen Sie?

    Warum nutzen Sie MÜ-Systeme?

  • Maschinelle Übersetzung im Alltag

    • Maschinelle Übersetzung begegnet uns ständig

    im Alltag:

    • „Übersetzen“-Funktion auf sozialen Medien

    • Technische Dokumentation von

    Softwareanwendungen, die maschinell

    übersetzt wurde

    • Rezensionen im Internet

    • u.v.m.

  • Maschinelle Übersetzung für

    SprachdienstleisterInnen

    • Es gibt viele Anbieter von MÜ-Systemen Beispiel für eine Liste mit MÜ-Systemen und

    verwandten Systemen: www.g2.com/categories/machine-translation

    • Aber welches System wählt man?

    http://www.g2.com/categories/machine-translation

  • Gründe für die Verwendung von MÜ

    • Verringerung der Übersetzungskosten

    • Beschleunigung Produkteinführung und

    Informationsfluss

    • Übersetzung von Dokumenten, die sonst nicht

    übersetzt werden könnten/würden

    • Steigerung der Übersetzungsproduktivität

    • Kürzere Durchlaufzeiten

    • Steigerung der Wettbewerbsfähigkeit (Nachfrage

    nach MÜ durch KundInnen)

  • Art MÜ-System Ansatz Ergebnis Vorteile Nachteile Grundlage

    Regelbasierte MÜ- Systeme

    Sprachalgorithme n, Grammatik, Wörterbücher

    Konsistente Übersetzungen, Terminologie

    Integration eigener Terminologie; Grammatik, Robustheit

    Weniger flüssig, Ausnahmen schwierig; hohe Entwicklungs- und Anpassungskosten

    Sprachregeln, zweisprachige Wörterbücher

    Statistische MÜ- Systeme

    Analyse von großen Datenmengen (Sprachpaar)

    Flüssige Übersetzung, weniger konsistente Übersetzungen

    Gute Qualität (bei ausreichend umfangreichen Korpora); flüssig lesbar

    Umfangreiche Korpora; nicht konsistente und nicht vorhersehbare Übersetzung

    Statistische Übersetzungsmod elle, die auf der Analyse von ein- und zweisprachigen Korpora beruhen

    Neuronale MÜ- Systeme

    Künstliche neuronale Netze

    Flüssige Übersetzungen

    Sehr flüssig lesbar, meist bessere Ergebnisse als statistische MÜ- Systeme

    Weniger transparent, Auslassungen, Terminologie

    Große Datenmengen, künstliche neuronale Netze

    Arten von MÜ-Systemen

  • Andere Unterscheidungsmöglichkeiten

    • kostenlose – kostenpflichtige MÜ-Systeme

    • Unternehmensintern (selbst entwickelt) – MÜ-

    Anbieter (Lizenz, SaaS usw.)

    • Generisch/Universalsystem – individuell

    angepasst

    • adaptiv/interaktiv

    • Ausmaß der Einbindung in

    Übersetzungsumgebung, z.B. CAT-Tool-Plug-in

  • Training von NMÜ-Systemen

    • Sprachressourcen (Korpora):

    • (Ein- und) zweisprachige Korpora

    • Eigene Korpora (Translation Memorys)

    • Frei verfügbare Korpora

    • Kostenpflichtige Korpora

    • Qualität der MÜ ist abhängig von (Quantität und

    Qualität der) Sprachressourcen

  • Sprachressourcen für MÜ-Training

    Als SprachdienstleisterIn:

    • Sprachressourcen zur Verfügung stellen

    • Ein MÜ-System trainieren

  • Datenschutz, Datensicherheit,

    Vertraulichkeit

  • Muss ich meinen KundInnen sagen, dass ich MÜ-

    Systeme verwende?

    Welche Erwartungen haben ÜbersetzerInnen an MÜ?

    Welche Erwartungen haben KundInnen an MÜ?

  • Welche rechtlichen Konsequenzen kann dies haben?

    Wie bleibt man im rechtlichen Rahmen?

  • Rechtliche Aspekte

    • AGBs und Nutzungsbedingungen der

    verwendeten Dienste berücksichtigen

    • Datenschutzgrundverordnung (DSGVO)

    • Weitergabe der Daten an Dritte

    • Vertraulichkeit

    • Vereinbarung mit den KundInnen treffen (DIN

    ISO 18587)

  • Pre-Editing und Post-Editing

  • Post-Editing (Posteditieren)

    • Bearbeitung und Korrektur der Ausgabe eines

    maschinellen Übersetzungssystems (durch

    SprachexpertInnen)

    • DIN ISO 18587: „Übersetzungsdienstleistungen –

    Posteditieren maschinell erstellter

    Übersetzungen – Anforderungen“:

    • Posteditieren (Verb): „Eine maschinell erstellte

    Übersetzung […] editieren und korrigieren“

  • Posteditieren laut DIN ISO 18587

    Prüfung des MÜ-Ergebnisses:

    • Genauigkeit

    • Verständlichkeit

    • Verbesserung der Lesbarkeit

    • Korrektur von Fehlern

    Unterscheidung zu Übersetzung: 3 Texte

    (Ausgangstext, MÜ-Ergebnis, finaler Zieltext)

  • Posteditieren laut DIN ISO 18587

    Ziele:

    • Verständlichkeit des Ergebnisses

    • Übereinstimmung des ausgangs- und

    zielsprachlichen Inhalts

    • Erfüllung der (projekt- bzw. kundenspezifischen)

    Anforderungen und Spezifikationen

  • Anforderungen an Post-Editing-Ergebnis

    • Konsistente fachgebietsspezifische (Kunden-

    )Terminologie

    • Standardmäßige Syntax, Orthographie,

    Interpunktion, diakritische Zeichen, Abkürzungen

    • Einhaltung von (Kunden-)Richtlinien, einschl.

    Stilrichtlinien und Post-Editing-Richtlinien

    • Formatierung

    • Zielgruppen- und zweckgerechter Inhalt

    • Erfüllung der Kundenvorgaben

  • Aufgabe: Übersetzung eines kurzen Textes mit einem maschinellen Übersetzungssystem und anschließender Fehlersuche

  • Welche Fehler haben Sie gefunden?

    Müssen diese Fehler bei jedem Auftrag ausgebessert

    werden?

  • Light vs. Full Post-Editing

    Umfang des Post-Editings abhängig von:

    • Übersetzungsauftrag/Projektspezifikationen

    • Erwartungen an die Qualität

    • Textfunktion (Skopos)

    • Textumfang

    • “Vergänglichkeit” der Informationen in der

    Übersetzung

    • Verortung am Spektrum von “Gisting” zur

    Veröffentlichung

  • Light vs. Full Post-Editing

    Leichtes Posteditieren (Light Post-Editing)

    Vollständiges Posteditieren (Full Post-Editing)

    Definition laut DIN ISO 18587

    Prozess des Posteditierens mit dem Ziel, einen lediglich verständlichen Text zu erhalten, ohne Anspruch, ein Produkt zu erzielen, das mit dem Ergebnis einer Humanübersetzung vergleichbar ist

    Prozess des Posteditierens mit dem Ziel, ein Produkt zu erhalten, das mit dem Ergebnis einer Humanübersetzung vergleichbar ist

    Ziel grobe Erfassung des Inhalts (Grundidee verstehen); keine Veröffentlichung

    Nicht unterscheidbar von Humanübersetzung

    Übersetzun gsergebnis

    Verständliches und genaues Übersetzungsergebnis OHNE stilistische Angemessenheit

    Verständliches, genaues und stilistisch angemessenes Ergebnis, einschl. korrekter Grammatik, Syntax und Interpunktion

  • Leichtes Posteditieren –

    Prinzipien (DIN ISO 18587)

    • MÜ-Ergebnis weitgehend nutzen

    • Auf Auslassungen und Ergänzungen überprüfen

    • Unpassende Inhalte editieren

    • Sätze mit falscher oder unklarer Bedeutung

    umstrukturieren

  • Vollständiges Posteditieren –

    Prinzipien (DIN ISO 18587)

    Zusätzlich:

    • Grammatikalisch, syntaktisch und semantisch

    korrekten Inhalt erstellen

    • Kunden- bzw. fachgebietsspezifische

    Terminologie einhalten

    • Rechtschreibung, Interpunktion, Silbentrennung

    • Angemessener Stil (Textsorte, Stilrichtlinien)

    • Formatierung

  • Automatic Post-Editing (APE)

    • Automatische Korrektur der MÜ

    • MÜ-System ist eine Black Box

    Zweck:

    • Behebung systematischer Fehler des MÜ-

    Systems

    • Verringerung des Aufwands beim Post-Editing

    • Anpassung eines MÜ-Systems an ein Fachgebiet

    oder ÜbersetzerInnen (Wortschatz, Stil usw.)

  • Kompetenzen von Posteditoren

    Laut ISO 18587 (vergleichbar mit ISO 17100):

    • Übersetzungskompetenz

    • Sprachliche und textliche Kompetenz in der

    Ausgangs- und Zielsprache

    • Recherchekompetenz, einschl.

    Informationsverarbeitung

    • Kulturelle Kompetenz

    • Technische Kompetenz

    • Sachgebietskompetenz

  • Pre-Editing

    Veränderung des Ausgangstexts, um das Ergebnis

    der maschinellen Übersetzung zu verbessern und

    den Post-Editing-A

Recommended

View more >