Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpus

Laten we beginnen. Het is Gratis
of registreren met je e-mailadres
Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpus Door Mind Map: Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpus

1. Hélène Rigolet, L3 SDL Section 3 et 4

2. Corpus

3. évaluer les informations morphosyntaxiques dans les dictionnaires

4. Dictionnaires monolingues allemands

5. Informations différentes

5.1. dictionnaires Wahrig et WDG

5.1.1. indiquent le neutre

5.2. Duben-GWB

5.2.1. indique le masculin et le neutre

6. la quantité et la qualité

6.1. jouent dans l’évaluation des résultats

7. Fréquence d'occurence

7.1. diffère d'un corpus à un autre

8. Corpus : Question de taille ?

8.1. Pas de corpus équilibrés de taille suffisante

8.2. Lexicographes et linguistes

8.2.1. Conscients des problèmes du manque de données

8.3. Estimer taille optimale

8.3.1. nombre de types

8.3.1.1. convergent

8.3.1.1.1. à partir d'une certaine taille

8.3.2. nombre de mots-formes

8.3.2.1. convergent

8.3.2.1.1. à partir d'une certaine taille

8.4. Analyse du DWDS-E

8.4.1. formes inintéressantes

8.4.1.1. chiffres

8.4.1.2. numéros de téléphone

8.4.1.3. dates

8.4.1.4. combinaisons particulières

8.4.1.5. noms propres de personnes et lieux

8.4.1.6. noms d'entreprises

8.4.2. formes analysables

8.4.2.1. mots-formes

8.4.3. lemmatisation

8.4.3.1. TAGH

8.4.3.1.1. analyseur morphosyntaxique

8.4.3.1.2. problème

8.4.4. lexèmes

8.4.4.1. sont répartis régulièrement

9. Corpus opportunistes

9.1. Non proportionnels à l'usage de tous les jours

9.2. Exemple

9.2.1. Bank of English

9.2.1.1. Collins

9.2.1.2. Université de Birmingham en 1991

9.2.1.3. textes écrits : genres différents que des transcriptions de langue orale

10. Grandes maisons d'édition

11. Institutions académiques

12. A partir du Web

12.1. pas vraiment de corpus

12.1.1. sur la base du lexique présent

12.1.2. sur l'ordre des résultats de Google

13. grandes collections de textes

13.1. de plusieurs langues

14. Défaut d'"équilibre" pour les types de textes

14.1. influence la qualité des résultats lexicographiques