Quelques problèmes observés dans l’élaboration de dictionnaires à partir de corpus

Get Started. It's Free
or sign up with your email address
Quelques problèmes observés dans l’élaboration de dictionnaires à partir de corpus by Mind Map: Quelques problèmes observés dans l’élaboration de dictionnaires à partir de corpus

1. CATELLA Laurine L3 SDL

2. 1. CORPUS ET DICTIONNAIRES : une comparaison quantitative

2.1. Taille

2.1.1. Dictionnaires

2.1.1.1. nombre d'entrées annoncées

2.1.2. Corpus

2.1.2.1. nombre de tokens

2.1.2.1.1. = chaîne de caractères entre deux blancs

2.1.2.2. nombre de types

2.1.2.2.1. = tokens différents dans le corpus

2.2. Constats

2.2.1. Corpus beaucoup trop petit pour entrer en compétition avec les grands dictionnaires

2.2.1.1. Brown Corpus (angl.)

2.2.1.1.1. 50 000 types

2.2.1.2. Dictionnaire OED (angl.)

2.2.1.2.1. 500 000 entrées

2.2.2. Corpus parfois beaucoup plus grand

2.2.2.1. DWDS-E (all.)

2.2.2.1.1. 9 millions de types

2.2.2.2. DWB (all.)

2.2.2.2.1. 297 000 entrées

2.3. Lacunes corpus

2.3.1. Rareté des occurrences

2.3.2. mots composés

2.3.2.1. transparence sémantique

3. 2. CORPUS ÉQUILIBRÉS

3.1. Mots simples

3.1.1. mots non attestés dans corpus

3.1.1.1. ex: Wesbter/BNC

3.1.2. lexèmes absents dans corpus

3.1.2.1. langage enfantin

3.1.2.2. variantes régionales

3.1.2.3. mots relevant de domaines de connaissance particulier

3.2. Mots composés

3.2.1. manque d’attestations dans les corpus

3.3. Expressions figées

3.3.1. Etude de fréquence

3.3.1.1. 46 expressions idiomatiques verbales (dans le Duden-11)

3.3.1.2. 100 échantillons de même taille contenant chacun 10 millions de tokens

3.3.1.3. 7 expressions n'apparaissent pas

3.3.2. Conclusion

3.3.2.1. Corpus équilibrés trop petits pour pouvoir servir de base à l’élaboration d’un grand dictionnaire monolingue

4. GEYKEN Alexander Académie des Sciences de Berlin