The DWDS corpus

Lancez-Vous. C'est gratuit
ou s'inscrire avec votre adresse e-mail
The DWDS corpus par Mind Map: The DWDS corpus

1. Fournir un équilibre

2. Rigolet Hélène, L3 SDL

3. Détail section 5

3.1. Procédure sélection sous-corpus

3.1.1. Prose, vers, théâtre 26%

3.1.1.1. 3 œuvres en prose

3.1.1.2. 2 œuvres littéraires

3.1.1.3. Fiction de la lumière

3.1.2. Journaux 27%

3.1.2.1. Rapports

3.1.2.2. Articles de périodiques

3.1.2.2.1. Échantillons rapports sur évènements spécifiques

3.1.3. Sciences 22%

3.1.3.1. 100 membres de l'Académie des Sciences

3.1.3.1.1. Représentent toutes les disciplines et domaines de connaissances majeures

3.1.4. Autres fictions 20%

3.1.4.1. Manuels réparation voitures

3.1.4.2. Livres cuisines

3.1.4.3. Textes de Loi

3.1.5. Transcriptions de la langue parlée

3.1.5.1. Avant

3.1.5.1.1. Conversations quotidiennes

3.1.5.1.2. Interview de télé, radio

3.1.5.1.3. Enregistrements discours dialectal

3.1.5.2. Aujourd'hui

3.1.5.2.1. Discours non spontanés

3.1.5.2.2. Avant 1945

3.1.5.2.3. Après 1945

3.1.6. Textes Autriche - Suisse

4. 1er corpus de référence pour la langue allemande

5. Équilibré ; grand

6. Lemmatisé

7. Utilisé comme source de travail

7.1. Linguistes

7.2. Historiens

7.3. Universitaires

7.4. Traducteurs

8. Académie des Sciences de Berlin-Brandebourg

8.1. De 2000 à 2003

8.1.1. Compilation de corpus

8.1.2. Travaux lexicologiques

8.2. Corpus actuel

8.2.1. Corpus de base

8.2.2. Corpus étendu

8.2.2.1. Opportuniste

8.2.2.1.1. opportunité de récupérer des textes

8.2.2.2. Presse, quotidien

8.3. Participants

8.3.1. Plus d'une centaine

8.3.2. Des chinois ont travaillé dessus

8.3.2.1. Crowd Sourcing

9. Motivations, but, spécification

9.1. Dictionnaires rendant compte les usages de la langues allemande

9.1.1. Représente le lexique du 20ème siècle

9.2. Classement

9.2.1. Catégories lexicales

9.2.1.1. Par décades / diachroniques

9.3. Par sélection manuelle

9.3.1. Plus équilibré

9.4. Besoins

9.4.1. Pour les apprenants de la langue

9.5. Accès libre et gratuit

10. Etapes

10.1. Sélection des textes

10.1.1. Sous-corpus (voir section 5)

10.2. Droits d'auteurs

10.2.1. Comité de personnalités publiques

10.2.2. Anonymat

10.3. Numérisation

10.3.1. Reconnaissance optique des caractères (ORC)

10.3.2. Transcription manuelle

10.3.3. Titres, chapitres

10.3.3.1. Annotés en TEI

10.3.4. TAGH = système d'analyse des morphèmes

10.3.5. Graphies étiquettées

10.4. Equilibre

10.4.1. Calculé tous les 10 ans

11. Alexander Geiken

12. Ce qui manque au corpus

12.1. Ce qui vient d'internet