13
Alba Collado Alba Collado Adell El Idrissi Adell El Idrissi

Corpora monolingües

  • Upload
    aeligo

  • View
    208

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Corpora monolingües

Alba ColladoAlba Collado

Adell El IdrissiAdell El Idrissi

Page 2: Corpora monolingües

¿Qué es un corpus?

• Conjunto de textos, normalmente almacenados en formato electrónico, seleccionados como elementos de referencia de una lengua o de una determinada variedad de la misma.

• Elementos de referencia para el estudio de una frase concreta o un cierto aspecto de la lengua.

Page 3: Corpora monolingües

¿Qué es un corpus?

• Debe cumplir unas características:

– Autenticidad– Extensión– Formato electrónico– Criterios específicos de recopilación

Page 4: Corpora monolingües

Tipos de corpora

• Monolingües• Bilingües• Multilingües

• Oral vs. escrito• Impreso vs. electrónico• Variaciones regionales,

sociales, etc.

Page 5: Corpora monolingües

Corpora monolingües

• Utilidad para el traductor:

– Búsqueda de términos en un contexto determinado.

– Consulta de estilo, fraseología, etc., en textos paralelos para mantener la función comunicativa.

– Creación de un corpus propio.

Page 6: Corpora monolingües

Corpora monolingües

• Funciones:

– De referencia: Bases para crear gramáticas, diccionarios, tesauros…

– Monitores: Se mantienen activos con la finalidad de permitir el estudio diacrónico de la lengua.

Page 7: Corpora monolingües

Conceptos

• Concordancia: Búsqueda de términos en su contexto frecuente (registro, estilo, variedad geográfica).

• Colocación: Búsqueda de elementos que suelen acompañar a ciertos términos (construcciones sintácticas, fraseología…).

Page 8: Corpora monolingües
Page 9: Corpora monolingües

Casos prácticos

Page 10: Corpora monolingües

Casos prácticos

Page 11: Corpora monolingües

Casos prácticos

Page 12: Corpora monolingües

Otros usosOtros usos• Adquisición de Adquisición de

conocimiento léxicoconocimiento léxico• Construcción de Construcción de

gramáticasgramáticas• Estudios Estudios

socioculturalessocioculturales• EstilísticaEstilística• Traducción automáticaTraducción automática• Reconocimiento del Reconocimiento del

hablahabla• Recuperación de Recuperación de

informacióninformación• Lexicografía Lexicografía

monolingüe y bilingüemonolingüe y bilingüe

• Construcción de Construcción de diccionarios diccionarios electrónicoselectrónicos

• Compilación de Compilación de lexicones lexicones computacionalescomputacionales

• Repositorios de Repositorios de información información terminológicaterminológica

Page 13: Corpora monolingües

Corpora monolingüe online

• Alemán:– COSMAS II des

Instituts für Deutsche Sprache

– Korpus des DWDS

• Francés:– Bases Corpus

Langage

• Castellano:– CREA (Últimos 25

años)– CORDE (+25)– Corpus del español

• Inglés:– British National Corpus– Corpus of

Contemporary American English