Corpus DWDS

Commencez. C'est gratuit
ou s'inscrire avec votre adresse courriel
Rocket clouds
Corpus DWDS par Mind Map: Corpus DWDS

1. Académie des sciences Berlin Brandenburg 2000/2003

1.1. Corpus principal

1.1.1. lemmatisés + catégories grammaticales

1.2. Corpus étendu

2. Nécessité d'un nouveau corpus

2.1. Aucun dico allemand suffisamment représentatif du lexique au 20ème siècle

2.2. Dicos traditionnels compilés par ordre alphabétique = problèmes

2.3. Dicos : pas de corpus équilibré de l'allemand

3. Exigences

3.1. Corpus équilibré

3.2. Critère de taille : assez grande

3.3. Quantité considérable de littérature

4. Kern Corpus

4.1. 1er corpus de référence (langue allemande)

4.2. Journalisme

4.3. Texte littéraire

4.4. Littérature scientifique

4.5. Autre (culinaire)

4.6. Transcriptions langue parlée

4.7. Version électronique des journaux

5. 4 étapes

5.1. Sélection texte

5.2. Droit d'auteur

5.2.1. Comité de personnalités publiques

5.2.2. accessible public

5.2.3. mot de passe

5.2.4. anonymat

5.3. Numérisation + Annotation

5.3.1. optical character recognition = ORC

5.3.2. Transcription manuelle

5.3.3. infos codées (titres, chapitres)

5.3.4. TAGH : système analyse morphème

5.4. Echantillonnage

6. ALBERT Myriam, SASSI Nina