1. Hélène Rigolet, L3 SDL Section 3 et 4
2. Corpus
3. évaluer les informations morphosyntaxiques dans les dictionnaires
4. Dictionnaires monolingues allemands
5. Informations différentes
5.1. dictionnaires Wahrig et WDG
5.1.1. indiquent le neutre
5.2. Duben-GWB
5.2.1. indique le masculin et le neutre
6. la quantité et la qualité
6.1. jouent dans l’évaluation des résultats
7. Fréquence d'occurence
7.1. diffère d'un corpus à un autre
8. Corpus : Question de taille ?
8.1. Pas de corpus équilibrés de taille suffisante
8.2. Lexicographes et linguistes
8.2.1. Conscients des problèmes du manque de données
8.3. Estimer taille optimale
8.3.1. nombre de types
8.3.1.1. convergent
8.3.1.1.1. à partir d'une certaine taille
8.3.2. nombre de mots-formes
8.3.2.1. convergent
8.3.2.1.1. à partir d'une certaine taille
8.4. Analyse du DWDS-E
8.4.1. formes inintéressantes
8.4.1.1. chiffres
8.4.1.2. numéros de téléphone
8.4.1.3. dates
8.4.1.4. combinaisons particulières
8.4.1.5. noms propres de personnes et lieux
8.4.1.6. noms d'entreprises
8.4.2. formes analysables
8.4.2.1. mots-formes
8.4.3. lemmatisation
8.4.3.1. TAGH
8.4.3.1.1. analyseur morphosyntaxique
8.4.3.1.2. problème
8.4.4. lexèmes
8.4.4.1. sont répartis régulièrement
9. Corpus opportunistes
9.1. Non proportionnels à l'usage de tous les jours
9.2. Exemple
9.2.1. Bank of English
9.2.1.1. Collins
9.2.1.2. Université de Birmingham en 1991
9.2.1.3. textes écrits : genres différents que des transcriptions de langue orale
10. Grandes maisons d'édition
11. Institutions académiques
12. A partir du Web
12.1. pas vraiment de corpus
12.1.1. sur la base du lexique présent
12.1.2. sur l'ordre des résultats de Google