Geyken Alexander, Article : « Quelques problèmes observés dans l'élaboration de dictionnaires à p...

Get Started. It's Free
or sign up with your email address
Geyken Alexander, Article : « Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpus » by Mind Map: Geyken Alexander, Article : « Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpus »

1. Dictionnaires

1.1. entrées

1.2. pas de chiffres, dates, noms de marque et noms propres

1.3. mots composés

1.3.1. pas toujours comptabilisés

2. Corpus

2.1. tokens

2.1.1. = chaines de caractères entre deux blancs

2.1.2. mot-forme

2.1.2.1. = tokens analysables morphologiquement

2.1.3. lexèmes

2.1.3.1. = mot-forme qui diffèrent par la flexion

2.2. types

2.2.1. = tokens différents dans le corpus

2.2.2. comptage informatique

2.2.2.1. données non significatives

2.3. mots composés

2.3.1. tous pris en compte

2.3.2. mais pas attestés

2.3.2.1. manque de données

3. Occurences

3.1. si forte occurrence dans le corpus

3.1.1. présent dans dictionnaire

3.2. si faible occurrence dans le corpus

3.2.1. pas présent dans dictionnaire

4. Mots simples et mots composés

4.1. lacunes

4.1.1. mots du langage enfantin

4.1.2. variantes régionales

4.1.3. domaines de connaissances particuliers

5. Expressions figées

5.1. union des échantillons + somme occurrences

5.1.1. croissance d'apparition

5.2. procédure d'échantillonnage correcte

5.3. si corpus < 1M tokens

5.3.1. pas suffisant pour mener une étude

6. BERTRAND Fanny DELORME Aurore L3 SDL Linguistique sur Corpus