Article de Geyken: "Quelques problèmes observés dans l'élaboration de dictionnaires à partir de c...

Solve your problems or get new ideas with basic brainstorming

Get Started. It's Free
or sign up with your email address
Article de Geyken: "Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpus" ; sections 3 et 4 by Mind Map: Article de Geyken: "Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpus" ; sections 3 et 4

1. Taille des corpus

1.1. problèmes

1.1.1. corpus équilibrés

1.1.1.1. assez grands?

1.2. optimal

1.2.1. données abondantes

1.2.1.1. pas de chiffre exact

1.3. forme du vocabulaire

1.3.1. analyse morpholgique

1.3.1.1. 2 listes

1.3.1.1.1. formes "inintéressantes"

1.3.1.1.2. formes analysables

1.3.1.2. lemmatisation

1.3.1.2.1. DWDS-E

1.3.1.2.2. système TAGH

1.3.1.3. décomposition correcte

1.3.1.3.1. problèmes

1.3.1.3.2. but

1.3.2. fonction d'accroissement du vocabulaire

1.3.2.1. DWDS-E

1.3.2.1.1. 100 échantillons

1.3.2.2. lexèmes

1.3.2.2.1. très régulièrement répartis

1.3.2.3. accroissement

1.3.2.3.1. plus modeste

1.3.2.3.2. nouveau lexème

1.3.2.3.3. grands corpus

1.3.3. exemples

1.3.3.1. "Selbst"

1.3.3.1.1. nombre de ses composés

1.3.3.1.2. comparaison des entrées

2. Notion de fréquence

2.1. fiable

2.2. genre grammatical

2.2.1. étude

2.2.1.1. fréquence genre anglicismes

2.2.1.1.1. DWDS

2.2.1.1.2. DWDS-E

2.2.1.1.3. IDS

2.2.1.1.4. recherche Google

2.2.1.2. 4 corpus

2.2.1.2.1. résultats différents

2.2.1.3. quantité + qualité

2.2.1.3.1. rôle important

2.3. archaïsmes

2.3.1. utilisation corpus

2.3.1.1. annoter/éliminer archaïsmes

2.3.2. problèmatique

2.3.2.1. absence données

2.3.2.1.1. absence dans langue

3. corpus opportunistes

3.1. créés par:

3.1.1. grandes maisons d'édition

3.1.2. institutions académiques

3.2. taille:

3.2.1. + grand que corpus équilibrés

3.3. choix des textes:

3.3.1. pas proportionnel à leur usage

3.3.2. hasard

3.3.3. textes publiés

3.3.3.1. journaux

3.3.3.2. formes électronique

3.4. exemples:

3.4.1. Bank of English

3.4.1.1. Collins & Université de Birmingham

3.4.2. DWDS-E

3.4.2.1. Académie des Sciences de Berlin et du Brandebourg

3.4.3. Corpus de la langue écrite

3.4.3.1. Institut de la langue allemande

3.5. utilités

3.5.1. attestations mots

3.5.2. attestations expressions rares

4. Corpus extraits du web

4.1. plusieurs langues

4.2. lexique présent

4.3. ordre des résultats

4.3.1. Google

5. PESTRE Marine L3 - SDL