G. Alexander, « Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpu...

Lancez-Vous. C'est gratuit
ou s'inscrire avec votre adresse e-mail
G. Alexander, « Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpus », Langages, 2008 par Mind Map: G. Alexander, « Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpus »,  Langages, 2008

1. Corpus DWDS-E (allemand)

1.1. 1 milliard de tokens ; 9 millions types

1.2. mots-formes "inintéressants"

1.3. occurences des types >10 fois

2. Corpus et dictionnaire : Comparaison quantitative

2.1. Corpus

2.1.1. tokens

2.1.1.1. chaînes caractères espacées

2.1.2. types

2.1.2.1. nombre de tokens différents

2.1.3. Loi de Zipf

2.1.3.1. rareté des occurrences (types)

2.1.4. mots-formes

2.1.4.1. tokens analysables morphologiquement

2.1.4.2. se différencient par la flexion

2.2. Dictionnaires monolingues

2.2.1. Nombre d'entrées

2.2.2. Lacunes ?

2.2.2.1. lexicographiques

3. Emma MERGOIL - L3 Linguistique sur corpus

4. Hausser : Webster > BNC

5. Corpus équilibrés

5.1. Mots simples

5.1.1. Mots du langage enfantin

5.1.1.1. 'Heiabett'

5.1.2. Variantes régionales

5.1.3. Domaines particuliers

5.1.3.1. 'Abdrusch'

5.2. Mots composés

5.2.1. manque d'attestation

5.3. Expressions figées

5.3.1. répartition et le nombre d’occurrences

5.3.2. -46 expressions idiomatiques Duden-11

5.3.3. -100 échantillons de 10 millions de tokens

5.3.4. -Calcul fréquence expressions idiomatiques

5.3.5. croissance d’apparition

5.3.5.1. échantillons + occurrences

5.3.6. Manque des expressions

5.3.6.1. hapax ?

6. DWDS (all.)

6.1. 7/46 expressions n'apparaissent pas