Geyken Alexander - « Quelques problèmes observés dans l'élaboration de dictionnaires à partir de ...

Project Control, Project Closing, Timeline template

Get Started. It's Free
or sign up with your email address
Geyken Alexander - « Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpus » by Mind Map: Geyken Alexander - « Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpus »

1. CORPUS ET DICTIONNAIRES : UNE COMPARAISON QUANTITATIVE

1.1. Observations

1.1.1. taille des dictionnaires

1.1.1.1. nombre d’entrées annoncées

1.1.1.1.1. Establish Project Objective

1.1.1.1.2. Establish Project Scope

1.1.1.1.3. Map Requirements

1.1.1.1.4. Map Solution

1.1.1.1.5. Map Training Requirement

1.1.1.1.6. Review Project Scope

1.1.2. taille des corpus

1.1.2.1. nombre de tokens

1.1.2.1.1. = chaîne de caractères entre deux blancs

1.1.2.2. nombre de types

1.1.2.2.1. = tokens différents dans le corpus

1.2. Résultats

1.2.1. dictionnaires

1.2.1.1. 80 000 - 500 000 entrées

1.2.2. corpus de 1ère génération<dictionnaires monolingues

1.2.2.1. ex : corpus Brown, corpus LIMAS

1.2.2.2. trop petits

1.2.2.2.1. 1 million de tokens

1.2.2.2.2. entre 50 000 et 110 000 types

1.2.3. autres corpus>dictionnaires monolingues

1.2.3.1. ex : BNC, DWDS, DWDS-E

1.2.3.2. 100 millions - 1 milliard de tokens

1.2.3.3. 650 000 - 9 millions de types

1.3. Conclusions

1.3.1. nombre de tokens induit nombre de types

1.3.2. notion de types ≠ notion d'entrées

1.3.3. introduction de nouveaux termes

1.3.3.1. mot-forme

1.3.3.1.1. = tokens analysables morphologiquement

1.3.3.2. lexème

1.3.3.2.1. = mots-formes qui ne se distinguent que par leur flexion

1.3.4. lacunes des corpus

1.3.4.1. certaines formes à éliminer

1.3.4.2. problème de mots-composés transparents

1.3.4.3. problème de rareté des occurrences

1.3.4.3.1. trop de prises en compte

2. DARNE Laurie - SDL L3

3. CORPUS EQUILIBRES

3.1. Mots présents dans les dictionnaires absents dans les corpus

3.1.1. mots enfantins

3.1.2. variantes régionales

3.1.3. mots à connaissances particulières

3.2. Mots présents dans les corpus absents dans les dictionnaires

3.2.1. Determine Frequency of Meetings

3.2.2. Schedule Meetings

3.2.3. Brief Project Board

3.2.4. Prepare Meetings

3.2.5. Conduct Meetings

3.2.6. Follow-up Meeting

3.3. Problème pour les expressions figées

3.4. corpus équilibrés trop petits pour servir de base à l’élaboration d’un grand dictionnaire monolingue.

4. notamment pour les mots composés