Commencez. C'est gratuit
ou s'inscrire avec votre adresse courriel
Rocket clouds
DWDS Corpus par Mind Map: DWDS Corpus

1. Corpus noyaux

1.1. 100 M mots

1.1.1. classement chronologique

1.1.2. basé sur 80 000 doc

1.2. Kerncorpus DWDS

1.2.1. numérisation

1.2.2. pb de transcription

1.2.2.1. relations avec 15 maisons d'éditions

1.2.2.2. existe pas textes entiers

1.2.2.3. protection avec mots de passe

1.2.3. sélection de textes

1.2.3.1. corpus équilibré

1.2.3.1.1. 20% ouvrages généraux

1.2.3.1.2. discours oraux transcrit non spontannés

1.2.3.1.3. textes littéraires

1.2.3.1.4. journalisme

1.2.3.1.5. procédure différente selon le genre

1.2.4. annotations structurelles et linguistiques

1.2.5. échantillonage

2. Quels besoins ?

2.1. Pb du classement alphabétique

2.2. pas de dico représentatif du lexique allemand

3. Construction à l'Académie de Sciences

3.1. Berlin Brandenburg

3.1.1. 2000-2003

4. Objectifs finaux

4.1. dictionnaire

4.2. compile de corpus

4.2.1. par travail lexico

5. Spécifications de sa création

5.1. nouveau classement

5.1.1. construction syntaxique

5.1.2. catégories lexicales

5.1.3. champs lexicaux

5.2. représentation lexique XXe et confrontation textes du passé

5.2.1. dév langue courante

5.2.2. voc empire germanique 1871-1918

5.2.3. voc République Weimar

5.2.4. voc 3e Reich

5.3. création grande base de données

5.3.1. filtrer mots importants et sens

5.3.2. prendre en compte la fréquence des usages

5.3.2.1. formes

5.3.2.2. sens

5.3.2.3. expressions multi-mots

5.3.3. stopper sélection manuelle

5.3.3.1. car trop de main d'oeuvre

6. Corpus supplémentaires

6.1. corpus étendu

6.1.1. 900 M mots

6.1.1.1. basés sur journaux 15 dernières années

6.1.1.1.1. littéraires

6.1.1.1.2. scientifiques

6.2. Ergänzungscorpus

6.2.1. corpus supplémentaire opportuniste 2004

7. DELORME Aurore L3