G. Alexander, « Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpu...

Get Started. It's Free
or sign up with your email address
G. Alexander, « Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpus », Langages, 2008 by Mind Map: G. Alexander, « Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpus »,  Langages, 2008

1. Hausser : Webster > BNC

2. Corpus DWDS-E (allemand)

2.1. 1 milliard de tokens ; 9 millions types

2.2. mots-formes "inintéressants"

2.3. occurences des types >10 fois

3. Corpus et dictionnaire : Comparaison quantitative

3.1. Corpus

3.1.1. tokens

3.1.1.1. chaînes caractères espacées

3.1.2. types

3.1.2.1. nombre de tokens différents

3.1.3. Loi de Zipf

3.1.3.1. rareté des occurrences (types)

3.1.4. mots-formes

3.1.4.1. tokens analysables morphologiquement

3.1.4.2. se différencient par la flexion

3.2. Dictionnaires monolingues

3.2.1. Nombre d'entrées

3.2.2. Lacunes ?

3.2.2.1. lexicographiques

4. Corpus équilibrés

4.1. Mots simples

4.1.1. Mots du langage enfantin

4.1.1.1. 'Heiabett'

4.1.2. Variantes régionales

4.1.3. Domaines particuliers

4.1.3.1. 'Abdrusch'

4.2. Mots composés

4.2.1. manque d'attestation

4.3. Expressions figées

4.3.1. répartition et le nombre d’occurrences

4.3.2. -46 expressions idiomatiques Duden-11

4.3.3. -100 échantillons de 10 millions de tokens

4.3.4. -Calcul fréquence expressions idiomatiques

4.3.5. croissance d’apparition

4.3.5.1. échantillons + occurrences

4.3.6. Manque des expressions

4.3.6.1. hapax ?

5. DWDS (all.)

5.1. 7/46 expressions n'apparaissent pas

6. Emma MERGOIL - L3 Linguistique sur corpus