Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
1
Université Pompeu Fabra - Barcelone – 13 juillet 2016Université Pompeu Fabra - Barcelone – 13 juillet 2016
Le Logoscope :Le Logoscope :
principes, processus et utilisationsprincipes, processus et utilisations
2/115
Équipe : ● Christophe Gérard● Delphine Bernhard● Ingrid Falk
Financement :● IDEX, Université de Strasbourg (2012-2015)
● Ministère de la culture (DGLFLF)
● Lauren Bruneau● Ann-Lise Rosio
3/115
Plan
1. Une ressource « exo-néographique »
2. Constitution de la ressource : 4 étapes
3. Thematic : détection automatique de thèmes
4. Publication et utilisation de la ressource
4/115
1. Une ressource « exo-néographique »
5/115
4 raisons
1. Création lexicale : une conception cosérienne
2. Une représentation historico-culturelle
3. Des objectifs non-lexicographiques
4. Un simple « matériau de remploi »
6/115
1.1. Diversité des pratiques et des termes
créationlexicale
7/115
1.1. Diversité des pratiques et des termes
créationlexicale
néologie / terminologie
linguistique
lexicographie
8/115
1.1. Diversité des pratiques et des termes
créationlexicale
néologie / terminologie
linguistique
lexicographie
mot nouveau
9/115
1.1. Diversité des pratiques et des termes
créationlexicale
néologie / terminologie
linguistique
lexicographie
mot nouveau
néonyme néoterme
néologismenéologie
10/115
1.1. Diversité des pratiques et des termes
11/115
1.1. Diversité des pratiques et des termes
créationlexicale
néologie / terminologie
linguistique
lexicographie
mot nouveau
néonyme néoterme
néologismenéologie
12/115
1.1. Diversité des pratiques et des termes
néologie néologisme
13/115
néologie(domaine d'étude / processus)
néologisme (produit : signe existant)
1.1. Diversité des pratiques et des termes
14/115
néologie(domaine d'étude / processus)
néologisme (produit : signe existant)
- signe unique : hapax
1.1. Diversité des pratiques et des termes
15/115
néologie(domaine d'étude / processus)
néologisme (produit : signe existant)
- signe unique : hapax
- signe en diffusion
1.1. Diversité des pratiques et des termes
16/115
néologie(domaine d'étude / processus)
néologisme (produit : signe existant)
- signe unique : hapax
- signe en diffusion
- signe tout juste intégré
1.1. Diversité des pratiques et des termes
17/115
1.1. Diversité des pratiques et des termes
18/115
1.1. Diversité des pratiques et des termes
créationlexicale
néologie / terminologie
linguistique
lexicographie
mot nouveau
néonyme néoterme
néologismenéologie
Quelle valeurdescriptive ?
19/115
1.1. Diversité des pratiques et des termes
créationlexicale
néologie / terminologie
linguistique
lexicographie
mot nouveau
néonyme néoterme
néologismenéologie
« Pseudo-concepts » ?
20/115
1.1. Diversité des pratiques et des termes
créationlexicale
néologie / terminologie
linguistique
lexicographie
mot nouveau
néonyme néoterme
néologismenéologie
21/115
1.1. Diversité des pratiques et des termes
créationlexicale
néologie / terminologie
linguistique
lexicographie
mot nouveau
néonyme néoterme
néologismenéologie
mot inédit néomot
22/115
1.1. Diversité des pratiques et des termes
créationlexicale
néologie / terminologie
linguistique
lexicographie
mot nouveau
néonyme néoterme
néologismenéologie
mot construit
mot inédit néomot
néosémie
23/115
1.1. Diversité des pratiques et des termes
créationlexicale
néologie / terminologie
linguistique
lexicographie
mot nouveau
néonyme néoterme
néologismenéologie
innovationmot construit
mot inédit néomot
néosémie
24/115
1.1. Diversité des pratiques et des termes
créationlexicale
néologie / terminologie
linguistique
lexicographie
mot nouveau
néonyme néoterme
néologismenéologie
innovationmot construit
mot inédit néomot
néosémie
25/115
1.1. Coseriu : « Systema, norma y habla »
Coseriu, E. (1973 (1952)) Sistema, norma y habla, in Teoría del lenguaje y lingüística general, cinco estudios, Madrid, Gredos.
26/115
1.1. Coseriu : « Systema, norma y habla »
Coseriu, E. (1973 (1952)) Sistema, norma y habla, in Teoría del lenguaje y lingüística general, cinco estudios, Madrid, Gredos.
innovation « indécorable »
27/115
1.1. Coseriu : « Systema, norma y habla »
Coseriu, E. (1973 (1952)) Sistema, norma y habla, in Teoría del lenguaje y lingüística general, cinco estudios, Madrid, Gredos.
innovation « indécorable »
in- / -able
28/115
1.1. Coseriu : « Systema, norma y habla »
Coseriu, E. (1973 (1952)) Sistema, norma y habla, in Teoría del lenguaje y lingüística general, cinco estudios, Madrid, Gredos.
innovation « indécorable »
in- / -able
décorer, inconnu...
29/115
1.1. Conception cosérienne : innovation
Tout, dans ce qui est dit par l’individu parlant – en tant que moyen
linguistique – [et] qui s’éloigne des modèles existants dans la
langue par laquelle s’établit la conversation, peut être appelé
innovation. (Coseriu 1958).
30/115
1.1. Conception cosérienne : adoption
Tout, dans ce qui est dit par l’individu parlant – en tant que moyen
linguistique – [et] qui s’éloigne des modèles existants dans la
langue par laquelle s’établit la conversation, peut être appelé
innovation. Et l’acceptation, de la part de celui qui écoute, d’une
innovation comme modèle pour des actes d’expressions
ultérieures peut être appelée adoption (Coseriu 1958).
31/115
1.1. Conception cosérienne : diffusion
Le changement linguistique (« changement dans la langue ») est la
diffusion ou la généralisation d’une innovation, ou encore,
nécessairement, une série d’adoptions successives. C’est-à-dire
que, en dernière analyse, tout changement est originairement une
adoption. (Coseriu 1958).
32/115
innovation
temps
diffu
sion disparition
a.
a.
a.
a.
a.
a.
a.
a.
a.
1.1. Conception intégrale de la création lex.
33/115
1.1. Conception intégrale de la création lex.
34/115
1.1 Création lexical : réseau conceptuel
innovation
diffusionadoption
texte
système
traditionsdiscursives
norme
individu
variation
35/115
1.2. Une représentation historico-culturelle
36/115
1.2. Corpus dynamique - médiatique
37/115
1.2. Evénements temporaires
« oxi » : emprunt temporaire
38/115
1.2. Evénements temporaires
« abenomics »
39/115
1.2. Discours média. > lexique standard
« zadiste » dans la presse française
40/115
1.2. Discours média. > lexique standard
« zadiste » dans les dictionnaires
41/115
1.2. Lexique et realia culturelles
Referendum du 25 juin 2016
42/115
1.2. Discours média. > lexique standard
« uberisation » dans la presse française
43/115
1.2. Discours média. > lexique standard
« uberisation » dans la presse française
44/115
1.2. Discours média. > lexique standard
« uberisation » dans la presse française
45/115
1.2. Discours média. > lexique standard
« uberisation » (diffusion multi-domaines)
46/115
1.3. Objectifs non-lexicographiques
● Pas de définition
● Pas de genre / nombre
● Pas de domaine d'expérience
Description lexicale minimaliste
47/115
1.3. Objectifs non-lexicographiques
Description lexicale maximaliste
48/115
1.3. Objectifs non-lexicographiques : raisons
● Savoir-faire lexicographique : spécialisé
● Rapidité nécessaire de la description
● Conception philologico-herméneutique
49/115
1.3. Conception philologico-herméneutique
RASTIER 2011,2015
50/115
1.3. Conception philologico-herméneutique
51/115
1.3. Conception philologico-herméneutique
52/115
1.3. Conception philologico-herméneutique
Rastier 2011
innovation
53/115
Néologie et genres textuels
Détrie : SMS
Napieralski : commentaire d'internaute
Cassado-Velarde : «columna »
Canete / Freixa : interview
54/115
1.3. Conception philologico-herméneutique
Spitzer (1910) : Die Wortbildung als stilistisches Mittel. Exemplifziert an Rabelais.
Riffaterre (1973) : « Poétique du néologisme ».
Coseriu (1981) : « Creatividad y técnica lingüística. Los tres niveles del lenguaje»
Peschel (2002) : Zum Zusammenhang zwischen Wortneubildung undTextkonstitution.
Vorger Camille (2011) : Poétique du slam : de la scène à l'école. Néologie,néostyles et créativité lexicale
Lacoste / Gérard (2016) : « Innovations et diffusions lexicales dans les écrits de laGrande Guerre (roman, lettres et journaux de combattants) ».
55/115
1.3. Conception philologico-herméneutique
Gérard, Christophe. « Création lexicale, sens et textualité : théories et analyses », PhiN,Philologie im Netz, 2011. [http://web.fu-berlin.de/phin/].
Gérard, Christophe. « Sémiotique interprétative des création verbales ». Driss Ablali / SémirBadir / Dominique Ducard (éd.). Documents, textes, oeuvres. Perspectives sémiotiques. PUR,2014, pp. 333-350.
Gérard, Christophe. /Kabatek, Johannes. « Introduction : la néologie sémantique en questions», Cahiers de lexicologie, Revue internationale de lexicologie et de lexicographie. EditionsClassiques, 2012, pp. 11-36.
Gérard, Christophe. / Falk, Ingrid. / Bernhard, Delphine. « Traitement automatisé de lanéologie : pourquoi et comment intégrer l’analyse thématique ? ». Actes du CMLF 2014. [<http://www.shs-conferences.org/articles/shsconf/pdf/2014/05/shsconf_cmlf14_01208.pdf>].
Gérard, Christophe. / Lacoste, Charlotte. « « Mots de la Grande Guerre » : créations inaperçueset usages réels dans les écrits de combattants. Étude de lexicologie textuelle » ». Gilles Siouffi /Odile Roynette (éd.). La première guerre mondiale et la langue. Rennes : PUR, 2016, àparaître.
Gérard, Christophe. « Comment juge-t-on les innovations lexicales. Typologie intégrale dujugement lexical. ». Actes du colloque La Fabrique des mots, Cerisy, 2016, à paraître.
56/115
1.4. « Matériau de remploi » pour...
57/115
1.4. « Matériau de remploi » pour...
58/115
1.4. « Matériau de remploi » pour...
59/115
1.4. « Matériau de remploi » pour...
60/115
1.4. « Matériau de remploi » pour...
61/115
1.4. « Matériau de remploi » pour...
62/115
1.4. « Matériau de remploi » pour...
63/115
1.4. « Matériau de remploi » pour...
64/115
1.4. « Matériau de remploi » pour...
Conflits sociaux, 2014-2015
65/115
2. Constitution de la ressource :
4 étapes
66/115
2.1. Schéma des 4 étapes
processus automatiques
processus manuels
67/115
2.1. Schéma des 4 étapes
processus automatiques
processus manuels
1.détection1.détection
68/115
2.1. Schéma des 4 étapes
processus automatiques
processus manuels
1.détection1.détection
2.sélection2.sélection
69/115
2.1. Schéma des 4 étapes
processus automatiques
processus manuels
1.détection1.détection
2.sélection2.sélection
3.description3.description
70/115
2.1. Schéma des 4 étapes
processus automatiques
processus manuels
1.détection1.détection
2.sélection2.sélection
3.description3.description
contextuelle
lexicale
71/115
2.1. Schéma des 4 étapes
processus automatiques
processus manuels
1.détection1.détection
2.sélection2.sélection
3.description3.description 4.intégration 4.intégration
72/115
La collecte : 4 étapes
processus automatiques
processus manuels
1.détection1.détection
2.sélection2.sélection
3.description3.description 4.intégration 4.intégration
73/115
2.1. Schéma des 4 étapes
processus automatiques
processus manuels
1.détection1.détection
2.sélection2.sélection
3.description3.description 4.intégration 4.intégration
74/115
2.2. Etape de détection : lexies simples
75/115
● Néologie sémantique (« steak», « caviar »)
● Unités polylexicales (« diplomatie environnementale »)
● Variation ling. contemporaine (« comme dit », « deuxième bureau »)
2.2. Etape de détection
76/115
2.2. Etape de détection : liste d'exclusion
77/115
2.2. Etape de détection : liste d'exclusion
● Corpus fra_mixed_2012
● Noms propres (UNITEX, Paris)
● Mots validés + faux-néologismes
78/115
2.2. Etape de détection : liste d'exclusion
● Corpus fra_mixed_2012
● Noms propres (UNITEX, Paris)
● Mots validés + faux-néologismes
= 22 MégaB. / 2 millions de formes (25/11/2015)
79/115
28 juin 2016
2.2. Etape de détection : collecte de textes
80/115
28 juin 2016
2.2. Etape de détection : collecte de textes
81/115
2.2. Etape de détection : liste de candidats
HAUT DE LISTE
82/115
2.2. Etape de détection : liste de candidats
BAS DE LISTE
antroponyme
antroponyme
antroponyme
antroponyme
83/115
2.2. Etape de détection : liste de candidats
BAS DE LISTE
antroponyme
antroponyme
antroponyme
antroponyme
balise HTML
balise HTML
84/115
2.2. Etape de détection : liste de candidats
BAS DE LISTE
antroponyme
antroponyme
antroponyme
antroponyme
balise HTML
balise HTML
nom d'entreprise
faux emprunt
85/115
2.2. Etape de sélection
86/115
2.2. Etape de sélection
Google :> 2000 occ.
Google :> 2000 occ.
Factiva :1980-2016
87/115
2.2. Etape de description lexicale
88/115
Procédés (annotation simplifée)
d'après Sablayrolles (2011)
MORSEM
SYNSEM
MORPH
EMP
89/115
2.3. Etape de description lexicale
MORSEM (suffixation)
90/115
2.2. Etape de description lexicale
composition ?
suffixation
91/115
2.2. Etape de description lexicale
composition ?
suffixation
92/115
2.3. Etape de description textuelle-discursive
93/115
2.3. Etape de description textuelle-discursive
94/115
2.3. Etape de description textuelle-discursive
95/115
2.4. Etape d'intégration à la base
● Innovations d'un mois
● Calcul Index BlackLab (« Bd »)
● Calcul des statistiques du site
96/115
Néolophilie (Libération) / néolophobie (Equipe)
97/115
Position textuelle
98/115
2.4. Etape d'intégration à la base
● Innovations d'un mois
● Calcul Index BlackLab (« Bd »)
● Calcul des statistiques du site
● Mise à jour Liste d'exclusion
99/115
3. Thematic :
détection automatique des thèmes
100/115
3. 70 thèmes
101/115
3. Détail des fchiers « Thème »
102/115
Documentation thématique
103/115
Documentation thématique
104/115
Enjeux de la thématique
Requête enrichie :
➔ Par sujet (ex. confits sociaux)
➔ Par pratique sociale (ex. économie)
105/115
« Confits sociaux » - 2014
106/115
Enjeux de la thématique
Requête enrichie :
➔ Par sujet (ex. confits sociaux)
➔ Par pratique sociale (ex. économie)
Création lexicale ↔ thèmes
107/115
Journal ↔ thème
108/115
Affxe ↔ thème : anti-
Attirances thématiques de anti-
109/115
Enjeux de la thématique
Requête enrichie :
➔ Par sujet (ex. confits sociaux)
➔ Par pratique sociale (ex. économie)
Création lexicale ↔ thèmes
Détection néologie sémantique
110/115
Néologie sémantique
111/115
Nouvelle thématique = nouveau sens
112/115
4. Publication et utilisation
de la ressource
113/115
Interface Web
114/115
Interface « browser » hors ligne
115/115
Twitter @_logoscope