Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpus, A. Geyken, 2008

Create a To-Do list for your upcoming tasks

Lancez-Vous. C'est gratuit
ou s'inscrire avec votre adresse e-mail
Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpus, A. Geyken, 2008 par Mind Map: Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpus, A. Geyken, 2008

1. 2- Corpus équilibrés

1.1. mots simples

1.1.1. mots du langage enfantin

1.1.2. variantes régionales

1.1.3. mots d'un domaine précis

1.2. mots composés

1.3. acceptions

1.4. expressions figés

1.4.1. décrire l’accroissement du nombre d’occurrences des expressions figées pour déduire la taille minimale qu’un corpus devait avoir

1.4.1.1. Méthode

1.4.1.1.1. 46 expressions idiomatiques verbales allemandes choisies au hasard dans le Duden - II

1.4.1.1.2. 100 échantillons de même taille contenant chacun 10 millions de tokens

1.4.1.1.3. calcul de fréquences des expressions

1.4.1.2. Résultats

1.4.1.2.1. 7 des 46 expressions n'apparaissent pas dans le corpus DWDS

1.4.1.2.2. courbe de croissance régulière

1.4.1.2.3. Les plus grands corpus équilibrés ne contiennent pas suffisamment d’attestations pour servir de base lexicographique unique

2. 3- Corpus opportunistes et grandes collections de textes

2.1. Bank ok English : 524 millions de tokens

2.2. élaborés à partir du web ou journaux électroniques

2.2.1. repose sur la base du lexique des textes et sur l’ordre des résultats fournis par Google

2.2.2. obtenir des attestations pour des mots et expressions rares

2.3. Hypothèse

2.3.1. la fréquence n'est pas un critère fiable

2.3.1.1. genre grammatical

2.3.1.1.1. Méthode

2.3.1.1.2. Résultats

2.3.1.2. utiliser les corpus pour découvrir les archaïsmes dans les dictionnaires : projet LexiView (Heid et al. 2000)

2.3.1.2.1. Méthode

2.3.1.2.2. Résultats