1. Fournir un équilibre
2. Rigolet Hélène, L3 SDL
3. Détail section 5
3.1. Procédure sélection sous-corpus
3.1.1. Prose, vers, théâtre 26%
3.1.1.1. 3 œuvres en prose
3.1.1.2. 2 œuvres littéraires
3.1.1.3. Fiction de la lumière
3.1.2. Journaux 27%
3.1.2.1. Rapports
3.1.2.2. Articles de périodiques
3.1.2.2.1. Échantillons rapports sur évènements spécifiques
3.1.3. Sciences 22%
3.1.3.1. 100 membres de l'Académie des Sciences
3.1.3.1.1. Représentent toutes les disciplines et domaines de connaissances majeures
3.1.4. Autres fictions 20%
3.1.4.1. Manuels réparation voitures
3.1.4.2. Livres cuisines
3.1.4.3. Textes de Loi
3.1.5. Transcriptions de la langue parlée
3.1.5.1. Avant
3.1.5.1.1. Conversations quotidiennes
3.1.5.1.2. Interview de télé, radio
3.1.5.1.3. Enregistrements discours dialectal
3.1.5.2. Aujourd'hui
3.1.5.2.1. Discours non spontanés
3.1.5.2.2. Avant 1945
3.1.5.2.3. Après 1945
3.1.6. Textes Autriche - Suisse
4. 1er corpus de référence pour la langue allemande
5. Équilibré ; grand
6. Lemmatisé
7. Utilisé comme source de travail
7.1. Linguistes
7.2. Historiens
7.3. Universitaires
7.4. Traducteurs
8. Académie des Sciences de Berlin-Brandebourg
8.1. De 2000 à 2003
8.1.1. Compilation de corpus
8.1.2. Travaux lexicologiques
8.2. Corpus actuel
8.2.1. Corpus de base
8.2.2. Corpus étendu
8.2.2.1. Opportuniste
8.2.2.1.1. opportunité de récupérer des textes
8.2.2.2. Presse, quotidien
8.3. Participants
8.3.1. Plus d'une centaine
8.3.2. Des chinois ont travaillé dessus
8.3.2.1. Crowd Sourcing
9. Motivations, but, spécification
9.1. Dictionnaires rendant compte les usages de la langues allemande
9.1.1. Représente le lexique du 20ème siècle
9.2. Classement
9.2.1. Catégories lexicales
9.2.1.1. Par décades / diachroniques
9.3. Par sélection manuelle
9.3.1. Plus équilibré
9.4. Besoins
9.4.1. Pour les apprenants de la langue
9.5. Accès libre et gratuit
10. Etapes
10.1. Sélection des textes
10.1.1. Sous-corpus (voir section 5)
10.2. Droits d'auteurs
10.2.1. Comité de personnalités publiques
10.2.2. Anonymat
10.3. Numérisation
10.3.1. Reconnaissance optique des caractères (ORC)
10.3.2. Transcription manuelle
10.3.3. Titres, chapitres
10.3.3.1. Annotés en TEI
10.3.4. TAGH = système d'analyse des morphèmes
10.3.5. Graphies étiquettées
10.4. Equilibre
10.4.1. Calculé tous les 10 ans