Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpus - Alexander GE...

시작하기. 무료입니다
또는 회원 가입 e메일 주소
Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpus - Alexander GEYKEN 저자: Mind Map: Quelques problèmes observés dans l'élaboration de dictionnaires à partir de corpus - Alexander GEYKEN

1. Corpus équilibré

1.1. MOTS SIMPLES OU COMPLEXES

1.1.1. Webster plus riche que BNC

1.1.2. WDG plus riche que DWDS

1.1.2.1. Lexèmes non représentés dans DWDS

1.1.3. Acceptions dans dictionnaires

1.1.3.1. Mots fréquents

1.1.3.2. Mots composés (encore moins représentés)

1.2. EXPRESSIONS FIGEES

1.2.1. Expérience dans DWDS-E

1.2.1.1. 46 expressions idiomatiques

1.2.1.2. 100 échantillons de 10 millions de Tokens

1.2.2. Croissance du nombre d'occurences

1.2.2.1. On peut déduire la taille minimale pour un corpus

1.2.3. Corpus équilibrés sont trop petits

1.2.3.1. Ne sont pas utilisés comme base

2. JOANNY Anaïs - L3

3. Corpus et dictionnaires: comparaison quantitative

3.1. DICTIONNAIRES

3.1.1. Taille

3.1.1.1. Nombre d'entrées annoncées

3.2. CORPUS

3.2.1. Taille

3.2.1.1. TOKENS

3.2.1.1.1. Chaînes de caractères entre 2 blancs

3.2.1.2. TYPES

3.2.1.2.1. Tokens différents dans corpus

3.2.1.3. MOTS-FORMES

3.2.1.3.1. Tokens analysables morphologiquement

3.2.1.4. LEXEMES

3.2.1.4.1. Mots-formes se distinguant par leur flexion

3.2.2. Lacunes orthographiques

3.2.2.1. Composés transparents

3.2.2.2. Rareté des occurences

3.2.2.3. Diversité de langues

3.3. Comparaison quantitative

3.3.1. Corpus (nb types)

3.3.1.1. DWDS (all)

3.3.1.1.1. 4,2 millions

3.3.1.2. DWDS-E (all)

3.3.1.2.1. 9 millions

3.3.2. Dictionnaires (nb entrées)

3.3.2.1. DWB

3.3.2.1.1. 297000

3.3.2.2. OED

3.3.2.2.1. 50000