Section 7 : Numérisation

Project Control, Project Closing, Timeline template

Get Started. It's Free
or sign up with your email address
Section 7 : Numérisation by Mind Map: Section 7 : Numérisation

1. GUILLY Julie et VIGIER Elsa L3 SDL

2. Production de fichiers

2.1. Format UMTF -8 avec balisage XML

2.2. Transformation en XML final + respect TEI

3. Disponibilité

3.1. 60% textes du Kernokorpus sous format électronique

3.1.1. achetés sous CD-ROMs

3.1.2. acquis des Maisons d’Édition

3.2. 40 millions de signes

3.2.1. 160 000 pages numérisées

4. Méthodes

4.1. Reconnaissance Optique de Caractère (ROC)

4.1.1. Plus rentable

4.1.2. Taux de reconnaissance

4.1.2.1. 95% à 99% acceptables

4.1.2.2. 100 erreurs tous les 10 000 mots

4.2. Transcription manuelle (cround sourcing)

4.2.1. Plus coûteux

4.2.2. "Double keying"

4.2.2.1. 5 erreurs tous les 10 000 mots

4.2.3. Facilite la conversion XML

5. Pré-édition

5.1. Basée sur feuilletage d'images

5.2. Étapes

5.2.1. Sélection document

5.2.2. Contrôle qualité de la saisie du texte

5.2.3. Majoration des parties difficiles du document