G. Alexander, « Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpu...

Autre

Emma Mergoil

Lancez-Vous. C'est gratuit

ou s'inscrire avec votre adresse e-mail

Cartes mentales similaires Plan de carte mentale

G. Alexander, « Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpus », Langages, 2008 par Emma Mergoil Mind Map: G. Alexander, « Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpus », Langages, 2008

Mind Map: G. Alexander, « Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpus », Langages, 2008

1. Corpus DWDS-E (allemand)

1.1. 1 milliard de tokens ; 9 millions types

1.2. mots-formes "inintéressants"

1.3. occurences des types >10 fois

2. Corpus et dictionnaire : Comparaison quantitative

2.1. Corpus

2.1.1. tokens

2.1.1.1. chaînes caractères espacées

2.1.2. types

2.1.2.1. nombre de tokens différents

2.1.3. Loi de Zipf

2.1.3.1. rareté des occurrences (types)

2.1.4. mots-formes

2.1.4.1. tokens analysables morphologiquement

2.1.4.2. se différencient par la flexion

2.2. Dictionnaires monolingues

2.2.1. Nombre d'entrées

2.2.2. Lacunes ?

2.2.2.1. lexicographiques

3. Emma MERGOIL - L3 Linguistique sur corpus

4. Hausser : Webster > BNC

5. Corpus équilibrés

5.1. Mots simples

5.1.1. Mots du langage enfantin

5.1.1.1. 'Heiabett'

5.1.2. Variantes régionales

5.1.3. Domaines particuliers

5.1.3.1. 'Abdrusch'

5.2. Mots composés

5.2.1. manque d'attestation

5.3. Expressions figées

5.3.1. répartition et le nombre d’occurrences

5.3.2. -46 expressions idiomatiques Duden-11

5.3.3. -100 échantillons de 10 millions de tokens

5.3.4. -Calcul fréquence expressions idiomatiques

5.3.5. croissance d’apparition

5.3.5.1. échantillons + occurrences

5.3.6. Manque des expressions

5.3.6.1. hapax ?

6. DWDS (all.)

6.1. 7/46 expressions n'apparaissent pas

ou S'inscrire