G. Alexander, « Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpu...

登録は簡単!. 無料です
または 登録 あなたのEメールアドレスで登録
G. Alexander, « Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpus », Langages, 2008 により Mind Map: G. Alexander, « Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpus »,  Langages, 2008

1. Corpus DWDS-E (allemand)

1.1. 1 milliard de tokens ; 9 millions types

1.2. mots-formes "inintéressants"

1.3. occurences des types >10 fois

2. Corpus et dictionnaire : Comparaison quantitative

2.1. Corpus

2.1.1. tokens

2.1.1.1. chaînes caractères espacées

2.1.2. types

2.1.2.1. nombre de tokens différents

2.1.3. Loi de Zipf

2.1.3.1. rareté des occurrences (types)

2.1.4. mots-formes

2.1.4.1. tokens analysables morphologiquement

2.1.4.2. se différencient par la flexion

2.2. Dictionnaires monolingues

2.2.1. Nombre d'entrées

2.2.2. Lacunes ?

2.2.2.1. lexicographiques

3. Emma MERGOIL - L3 Linguistique sur corpus

4. Hausser : Webster > BNC

5. Corpus équilibrés

5.1. Mots simples

5.1.1. Mots du langage enfantin

5.1.1.1. 'Heiabett'

5.1.2. Variantes régionales

5.1.3. Domaines particuliers

5.1.3.1. 'Abdrusch'

5.2. Mots composés

5.2.1. manque d'attestation

5.3. Expressions figées

5.3.1. répartition et le nombre d’occurrences

5.3.2. -46 expressions idiomatiques Duden-11

5.3.3. -100 échantillons de 10 millions de tokens

5.3.4. -Calcul fréquence expressions idiomatiques

5.3.5. croissance d’apparition

5.3.5.1. échantillons + occurrences

5.3.6. Manque des expressions

5.3.6.1. hapax ?

6. DWDS (all.)

6.1. 7/46 expressions n'apparaissent pas