Les Langages Documentaires

Commencez. C'est gratuit
ou s'inscrire avec votre adresse courriel
Rocket clouds
Les Langages Documentaires par Mind Map: Les Langages Documentaires

1. Généralités

1.1. Définition : quoi?

1.2. Utilité : pour quoi?

1.3. Historique : quand?

1.3.1. prémices

1.3.2. début du classement documentaire

1.3.3. début de l'indexation

1.4. Structure des langages doc : comment?

1.4.1. structure hiérarchique

1.4.2. structure combinatoire

2. Indexation

2.1. Mise en oeuvre : comment?

2.1.1. analyse

2.1.2. extraction mots clés

2.1.3. transposition en langage doc

2.1.3.1. indice

2.1.3.2. vedette

2.2. problèmes pratiques et politiques d'indexation

2.2.1. problèmes

2.2.1.1. public spécialiste ou non

2.2.1.2. selection du sujet principal

2.2.1.3. la règle du cutter

2.2.1.4. attention a la surindexation

2.2.1.5. hypothèses et théories de l'auteur

2.2.1.6. se limiter au sujets explicites ou indiquer les implicites

2.2.1.7. prévoir exhaustivement les attentes des interrogateur

2.2.1.8. démêler le sujet de départ et l'apport de l'auteur

2.2.1.9. tenir compte du point de vue particulier de l'auteur

2.2.2. écueils

2.2.2.1. analyse insuffisante du document

2.2.2.2. surindexation : trop de mots clés extraits

3. Langages documentaire

3.1. Classification Décimale Universelle (Paul Otlet et Henri Lafontaine)

3.1.1. Histoire

3.1.2. Structure

3.1.3. Mises à jour

3.1.3.1. 2001: 7e MAJ Française

3.2. à structure combinatoire

3.2.1. lexiques documentaires

3.2.1.1. listes de mots-clés

3.2.1.2. listes/répertoires de vedettes-matières

3.2.1.2.1. RAMEAU

3.2.1.3. fonctionnement des listes d'autorité-matière

3.2.1.3.1. terme précis du sujet

3.2.1.3.2. règles de construction

3.2.1.3.3. renvois

3.2.2. Thésauri

3.2.2.1. Définition

3.2.2.2. 2 fonctions principales

3.2.2.2.1. vocabulaire normalisé pour assurer la cohérence pour l'indexation

3.2.2.2.2. fournir une structure de renvois simples et clairs pour les différents termes

3.2.2.3. caractéristiques d'un thésaurus

3.2.2.3.1. basé sur les mots du langage naturel

3.2.2.3.2. pas seulement unitermes mais aussi groupes de mots

3.2.2.3.3. termes le plus souvent singulier sauf si singulier et pluriels ont des sens différents

3.2.2.3.4. écarte les synonymes (deviennent non descripteurs avec renvoi automatique sur les descripteurs correspondants)

3.2.2.3.5. développe des relations d'association et de voisinage de descripteurs ayant un rapport

3.2.2.3.6. hiérarchisation des descripteurs

3.2.2.4. relations entre descripteurs

3.2.2.4.1. équivalence (EM employer, EP employer pour)

3.2.2.4.2. associativité (TA terme associé)

3.2.2.4.3. hiérachique (TG terme générique, TS terme spécifique

3.2.2.5. organisation d'un thésaurus

3.2.2.5.1. liste alphabétique permutée

3.2.2.5.2. liste alphabétique structurée

3.2.2.5.3. liste par champs sémantiques

3.2.2.6. exemples

3.2.2.6.1. Thésaurus UNESCO

3.2.2.6.2. Thésaurus Eurovoc 4.2

3.2.2.6.3. Thésaurus Motbis

3.3. à structure hierarchique

3.3.1. généralités

3.3.1.1. définition

3.3.1.2. typologie

3.3.1.2.1. monohiérarchique

3.3.1.2.2. à facettes

3.3.1.3. historique

3.3.1.3.1. accès limité aux collections/fonds

3.3.1.3.2. libre accès aux collections/fonds

3.3.1.4. nature

3.3.1.4.1. encyclopédique

3.3.1.4.2. spécialisé

3.3.2. Classification Décimale Dewey

3.3.2.1. informations générales

3.3.2.1.1. 1ère classification : 1876

3.3.2.1.2. 1ère classification en terme d'importance (la plus utilisée mondialement aujourd'hui)

3.3.2.2. structure

3.3.2.2.1. historique

3.3.2.2.2. problèmes

3.3.2.2.3. principes de fonctionnement

3.3.2.3. Mises à jour

3.3.2.3.1. tous les 7ans

3.3.2.3.2. 11 MAJ du vivant de Melvil Dewey

3.3.2.3.3. 2011 : 23e édition

3.3.2.3.4. problèmes persistants

3.3.3. Classification Décimale Universelle (Paul Otlet et Henri Lafontaine)

3.3.3.1. Histoire

3.3.3.2. Structure

3.3.3.2.1. 10 classes dont 1 vide

3.3.3.3. Mises à jour

3.3.3.3.1. 2001: 7e édition Française

3.3.3.3.2. édition informatisée en cours d'élaboration

3.3.4. Classification alphanumérique Nicolas Clément

3.3.4.1. Histoire

3.3.4.2. Structure

3.3.4.2.1. 23 divisions

3.3.5. Classification alphanumérique de la Bibliothèque du congrès (LCC : Library Congress Classification)

3.3.5.1. Histoire

3.3.5.2. Structure

3.3.5.2.1. 20 classes principales

3.3.5.2.2. 1 classe pour ouvrages généraux (annuaires, encyclopédie, dictionnaires)

3.3.6. Classification à facettes (Colon Classification (CC))

3.3.6.1. Historique

3.3.6.2. Grands Principes

3.3.6.2.1. livre sont fait pour êtres lus

3.3.6.2.2. chaque lecteur doit trouver le livre qui lui convient

3.3.6.2.3. chaque livre doit pouvoir être repéré

3.3.6.2.4. le temps du lecteur doit être économisé

3.3.6.2.5. une bibliothèque est un organisme qui évolue

3.3.6.3. 5 notions fondamentales

3.3.6.3.1. La personnalité

3.3.6.3.2. La matière

3.3.6.3.3. L'énergie

3.3.6.3.4. l'espace

3.3.6.3.5. le temps

3.3.6.4. syntaxe

3.3.6.4.1. la classe principale du sujet

3.3.6.4.2. la séquence PMEST (correspond aux 5 notions fondamentales)

3.3.6.4.3. indication de cycles et de niveau

3.3.7. Classification à facettes de Bliss (Bibliographic Classification (BC))

3.3.7.1. Historique

3.3.7.2. Grands principes

3.3.7.2.1. 43 disciplines principales

3.3.8. Autres Classifications plus récentes

3.3.8.1. classification alphabétique de Daniel Moatti

3.3.8.2. Classification par intérêt (Nicolas Roubakine)

4. Récapitulatif

4.1. classifications

4.1.1. avantages

4.1.1.1. système universel

4.1.1.2. regroupement des notions sous un indice précis

4.1.1.3. classement des ouvrages suivant le classement des fiches

4.1.2. inconvénients

4.1.2.1. manque de souplesse

4.1.2.2. difficile d'introduire de nouveaux indices

4.1.2.3. volume important des tables

4.1.2.4. peu adapté a des domaines très spécifiques

4.1.2.5. complexité et longueur des indices pour les notions complexes

4.1.3. observations

4.1.3.1. mieux adaptées aux bibliothèques qu'aux services de documentation

4.2. lexiques de mots

4.2.1. avantages

4.2.1.1. grande souplesse

4.2.1.2. indexation fine

4.2.1.3. mises a jour sans problème, adaptées a l'automatisation

4.2.2. inconvénients

4.2.2.1. encombrement du fichier matière

4.2.2.2. manque de hiérarchisation, difficultés de la recherche

4.2.2.3. impossibilité de classer les documents sur les rayonnage avec ce systeme

4.2.3. observations

4.2.3.1. conviennent mieux à un service de documentation

4.3. thésaurus

4.3.1. avantages

4.3.1.1. grande souplesse

4.3.1.2. hiérarchisation

4.3.1.3. universalité dans son domaine

4.3.1.4. indexation en profondeur, automatisation

4.3.2. inconvénients

4.3.2.1. encombrement des fichiers dans les systèmes manuels

4.3.2.2. rangement sur rayonnage différent du classement dans le fichier

4.3.3. observations

4.3.3.1. convient à un service de documentation automatisé ou avec perspective d'automatisation

4.3.3.2. outil de recherche des bases de données

5. Indexation Automatique

5.1. Définition

5.2. Etapes prélables

5.2.1. éliminer les mots vides (mots de liaisons)

5.2.2. éliminer synonymes, homonymes

5.2.3. lemmatisation (mot sous forme canonique)

5.2.3.1. verbes a l'infinitif

5.2.3.2. adjectifs et substantif dans leur forme masculin ou féminin singulier

5.3. procédures d'indexation 4 niveaux envisageables

5.3.1. niveau 1: extraction simple

5.3.2. niveau 2: extraction contextualisées

5.3.3. niveau 3: travail sur le mot, la polysémie, calcul interprétatif élémentaire

5.3.4. niveau 4: calcul interprétatif complexe, travail sur les mots et le texte

5.4. Les différentes méthodes d'indexation automatique

5.4.1. Méthode KWIC et KWOC

5.4.2. Méthode Statistique

5.4.3. Méthode Linguistique

5.4.3.1. SYNTOL

5.4.3.2. Après SYNTOL

5.4.3.2.1. Analyse Morphologique

5.4.3.2.2. Analyse Syntaxique

5.4.3.2.3. Analyse Sémantique

5.4.4. Méthode mixte

5.4.4.1. module linguistique

5.4.4.1.1. étapes

5.4.4.2. module fichier inverse

5.4.4.3. module statistique

5.4.4.4. module d'interrogation

5.4.5. Evolution des outils