Article de Geyken: "Quelques problèmes observés dans l'élaboration de dictionnaires à partir de c...

Solve your problems or get new ideas with basic brainstorming

Lancez-Vous. C'est gratuit
ou s'inscrire avec votre adresse e-mail
Article de Geyken: "Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpus" ; sections 3 et 4 par Mind Map: Article de Geyken: "Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpus" ; sections 3 et 4

1. Taille des corpus

1.1. problèmes

1.1.1. corpus équilibrés

1.1.1.1. assez grands?

1.2. optimal

1.2.1. données abondantes

1.2.1.1. pas de chiffre exact

1.3. forme du vocabulaire

1.3.1. analyse morpholgique

1.3.1.1. 2 listes

1.3.1.1.1. formes "inintéressantes"

1.3.1.1.2. formes analysables

1.3.1.2. lemmatisation

1.3.1.2.1. DWDS-E

1.3.1.2.2. système TAGH

1.3.1.3. décomposition correcte

1.3.1.3.1. problèmes

1.3.1.3.2. but

1.3.2. fonction d'accroissement du vocabulaire

1.3.2.1. DWDS-E

1.3.2.1.1. 100 échantillons

1.3.2.2. lexèmes

1.3.2.2.1. très régulièrement répartis

1.3.2.3. accroissement

1.3.2.3.1. plus modeste

1.3.2.3.2. nouveau lexème

1.3.2.3.3. grands corpus

1.3.3. exemples

1.3.3.1. "Selbst"

1.3.3.1.1. nombre de ses composés

1.3.3.1.2. comparaison des entrées

2. Notion de fréquence

2.1. fiable

2.2. genre grammatical

2.2.1. étude

2.2.1.1. fréquence genre anglicismes

2.2.1.1.1. DWDS

2.2.1.1.2. DWDS-E

2.2.1.1.3. IDS

2.2.1.1.4. recherche Google

2.2.1.2. 4 corpus

2.2.1.2.1. résultats différents

2.2.1.3. quantité + qualité

2.2.1.3.1. rôle important

2.3. archaïsmes

2.3.1. utilisation corpus

2.3.1.1. annoter/éliminer archaïsmes

2.3.2. problèmatique

2.3.2.1. absence données

2.3.2.1.1. absence dans langue

3. corpus opportunistes

3.1. créés par:

3.1.1. grandes maisons d'édition

3.1.2. institutions académiques

3.2. taille:

3.2.1. + grand que corpus équilibrés

3.3. choix des textes:

3.3.1. pas proportionnel à leur usage

3.3.2. hasard

3.3.3. textes publiés

3.3.3.1. journaux

3.3.3.2. formes électronique

3.4. exemples:

3.4.1. Bank of English

3.4.1.1. Collins & Université de Birmingham

3.4.2. DWDS-E

3.4.2.1. Académie des Sciences de Berlin et du Brandebourg

3.4.3. Corpus de la langue écrite

3.4.3.1. Institut de la langue allemande

3.5. utilités

3.5.1. attestations mots

3.5.2. attestations expressions rares

4. Corpus extraits du web

4.1. plusieurs langues

4.2. lexique présent

4.3. ordre des résultats

4.3.1. Google

5. PESTRE Marine L3 - SDL