
1. Corpus DWDS-E (allemand)
1.1. 1 milliard de tokens ; 9 millions types
1.2. mots-formes "inintéressants"
1.3. occurences des types >10 fois
2. Corpus et dictionnaire : Comparaison quantitative
2.1. Corpus
2.1.1. tokens
2.1.1.1. chaînes caractères espacées
2.1.2. types
2.1.2.1. nombre de tokens différents
2.1.3. Loi de Zipf
2.1.3.1. rareté des occurrences (types)
2.1.4. mots-formes
2.1.4.1. tokens analysables morphologiquement
2.1.4.2. se différencient par la flexion
2.2. Dictionnaires monolingues
2.2.1. Nombre d'entrées
2.2.2. Lacunes ?
2.2.2.1. lexicographiques
3. Emma MERGOIL - L3 Linguistique sur corpus
4. Hausser : Webster > BNC
5. Corpus équilibrés
5.1. Mots simples
5.1.1. Mots du langage enfantin
5.1.1.1. 'Heiabett'
5.1.2. Variantes régionales
5.1.3. Domaines particuliers
5.1.3.1. 'Abdrusch'
5.2. Mots composés
5.2.1. manque d'attestation
5.3. Expressions figées
5.3.1. répartition et le nombre d’occurrences
5.3.2. -46 expressions idiomatiques Duden-11
5.3.3. -100 échantillons de 10 millions de tokens
5.3.4. -Calcul fréquence expressions idiomatiques
5.3.5. croissance d’apparition
5.3.5.1. échantillons + occurrences
5.3.6. Manque des expressions
5.3.6.1. hapax ?