Fiche de lecture n°10

Publié le par Anaïs

FREYRE, Elisabeth. Structuration et description automatique des documents électroniques: le projet européen METAe, du moteur d'exécution aux outils d'édition, Culture et Recherche [En ligne] 2004, n°100, p.7-8. Dossier "Les bibliothèques numériques". Disponible sur <http://www.culture.gouv.fr/culture/editions/r-cr/cr100.pdf> (Page consultée le 27 janvier 2006)


L'auteur

Elisabeth Freyre est chargée de mission du secteur Europe à la délégation aux relations internationales de la BNF.


Le document

Le projet européen METAe lancé en 2000 a conduit à l'élaboration de l'outil doc Works/METAe Edition permettant à partir des textes numérisés en mode image: la structuration logique, l'OCR, la génération de métadonnées descriptives et la conversion des documents en format XML, les fichiers obtenus sont réutilisables par d'autres applications (moteur de recherche ou produire des fonctions HTML). Le projet a été possible grâce à la coopération entre des partenaires techniques qui ont développé les outils et les structures documentaires qui ont fourni des échantillons de documents numérisés et qui ont testé ces outils. L'accent a été mis sur la reconnaissance des polices de caractères du XIX ème siècle et l'accès aux non voyants aux documents numérisés.

La description du document est fait par l'alimentation de métadonnées descriptives et administratives respectant le modèle METS (Metadata Encoding and Transmission Standart). Certaines tâches sont automatisée comme la génération des métadonnées relatives au contenu du document (image ou texte, type de police,...) et le repérage de la structure du document. Les métadonnées sont stockées dans une base de données interne capable de générer un fichier XML. Il est possible d'y effectuer des corrections manuelles.

L'outil dispose d'une fonction automatique d'apprentissage et s'il a été au départ conçu pour le traitement des livres et périodiques, il est également possible d'étendre sa grammaire à d'autres types de documents.

L'outil METAe est déjà utilisé par certaines institutions européennes, une des applications possibles de cet outil à la BNF pourrait être par exemple la génération à la demande de fichiers texte à partir des documents numérisés en mode image. Cet outil présente l'avantage d'une grande simplicité d'utilisation et garanti l'accessibilité et la conservation des documents.

 

Commentaire

Cette synthèse du projet METAe est très riche, outre le fait de décrire ce projet précisément, elle permet de faire état des avancés en matière de description du document et de la structuration de l'information. J'ai cependant regretté que les travaux de la Bibliothèque universitaire de Linz pour l'accès des non-voyants aux documents numérisés n'ait pas été développés. De plus il aurait intéressant de donner des informations sur certains des choix pris par les acteurs du projet. Par exemple, pourquoi avoir choisi de faire fonctionner cet outil sur une plateforme Windows? Est ce un choix technique ou de stratégie commerciale? De plus, si j'ai bien compris cet outil issu de la collaboration de partenaires publics sera vendu. Je me demande si il ne serait pas intéressant qu'une politique permettant un accés facilté à ce type d'outil soit mise en place afin qu'il n'y ait pas d'avancés à plusieurs niveaux selon la richesse de l'institution concernée et son pays d'origine.

Commenter cet article

voyance gratuite amour 18/01/2017 15:52

Bravo ! Votre blog est l'un des meilleurs que j'ai vu !

voyance mail serieuse gratuite 04/01/2017 17:55

Vraiment très intéressant. Bonne continuation à vous !

voyance gratuite par mail rapide 05/12/2016 16:07

Bravo ! Votre blog est l'un des meilleurs que j'ai vu !

voyance gratuite mail 23/11/2016 11:35

site bien fait !!! Merci pour ce magnifique partage !!! bonne continuation

voyance gratuite en ligne 17/10/2016 11:33

Bravo ! Votre blog est l'un des meilleurs que j'ai vu !