Lundi 30 janvier 2006

FREYRE, Elisabeth. Structuration et description automatique des documents électroniques: le projet européen METAe, du moteur d'exécution aux outils d'édition, Culture et Recherche [En ligne] 2004, n°100, p.7-8. Dossier "Les bibliothèques numériques". Disponible sur <http://www.culture.gouv.fr/culture/editions/r-cr/cr100.pdf> (Page consultée le 27 janvier 2006)


L'auteur

Elisabeth Freyre est chargée de mission du secteur Europe à la délégation aux relations internationales de la BNF.


Le document

Le projet européen METAe lancé en 2000 a conduit à l'élaboration de l'outil doc Works/METAe Edition permettant à partir des textes numérisés en mode image: la structuration logique, l'OCR, la génération de métadonnées descriptives et la conversion des documents en format XML, les fichiers obtenus sont réutilisables par d'autres applications (moteur de recherche ou produire des fonctions HTML). Le projet a été possible grâce à la coopération entre des partenaires techniques qui ont développé les outils et les structures documentaires qui ont fourni des échantillons de documents numérisés et qui ont testé ces outils. L'accent a été mis sur la reconnaissance des polices de caractères du XIX ème siècle et l'accès aux non voyants aux documents numérisés.

La description du document est fait par l'alimentation de métadonnées descriptives et administratives respectant le modèle METS (Metadata Encoding and Transmission Standart). Certaines tâches sont automatisée comme la génération des métadonnées relatives au contenu du document (image ou texte, type de police,...) et le repérage de la structure du document. Les métadonnées sont stockées dans une base de données interne capable de générer un fichier XML. Il est possible d'y effectuer des corrections manuelles.

L'outil dispose d'une fonction automatique d'apprentissage et s'il a été au départ conçu pour le traitement des livres et périodiques, il est également possible d'étendre sa grammaire à d'autres types de documents.

L'outil METAe est déjà utilisé par certaines institutions européennes, une des applications possibles de cet outil à la BNF pourrait être par exemple la génération à la demande de fichiers texte à partir des documents numérisés en mode image. Cet outil présente l'avantage d'une grande simplicité d'utilisation et garanti l'accessibilité et la conservation des documents.

 

Commentaire

Cette synthèse du projet METAe est très riche, outre le fait de décrire ce projet précisément, elle permet de faire état des avancés en matière de description du document et de la structuration de l'information. J'ai cependant regretté que les travaux de la Bibliothèque universitaire de Linz pour l'accès des non-voyants aux documents numérisés n'ait pas été développés. De plus il aurait intéressant de donner des informations sur certains des choix pris par les acteurs du projet. Par exemple, pourquoi avoir choisi de faire fonctionner cet outil sur une plateforme Windows? Est ce un choix technique ou de stratégie commerciale? De plus, si j'ai bien compris cet outil issu de la collaboration de partenaires publics sera vendu. Je me demande si il ne serait pas intéressant qu'une politique permettant un accés facilté à ce type d'outil soit mise en place afin qu'il n'y ait pas d'avancés à plusieurs niveaux selon la richesse de l'institution concernée et son pays d'origine.

Dimanche 29 janvier 2006

GELINAS, Marie-Anne. Les compétences requises pour la diffusion d’une collection numérique. In BN du Québec. Site de la Bibliothèque Nationale du Québec. [En ligne]. Disponible sur :<http://www.banq.qc.ca/documents/a_propos_bnq/communiques/ma_gelinas.pdf> (Page consultée le 20 janvier 2006)

L'auteur

Technicienne en documentation à l’Université du Québec, Marie-Anne Gélinas a reçu le prix d’excellence de la Bibliothèque Nationale du Québec pour ce document.

L'article

Marie-Anne Gélinas nous fait part de sa vision de la bibliothèque numérique, elle rappelle qu'il s'agit avant tout d'une banque de documents, mais à la différence d'Internet ceux-ci sont ordonnés et fiables. De plus, les différente étapes de traitements des documents numérisées sont les mêmes que pour un document analogique: acquisition, traitement, conservation et diffusion.
Le métier de technicien en documentation devient polyvalent et très évolutif dans le sens que les possibilités de gestion et de structuration et de mise à disposition de l'information sont en constantes évolutions. La formation doit également être assurer à l'usager afin qu'il puisse exploiter les nouveaux outils mis à sa disposition.
Le travail coopératif est capital pour la réussite d'une bibliothèque numérique et cela avec les informaticien et les autres structures documentaires de son environnement. La bibliothèque numérique doit être intégrée au reste de la structure, s'il existe un catalogue des documents analogiques il serait intéressant que les documents numérisés y soient intégrés.


Commentaire

Ce document extrêmement synthétique est intéressant pour une première approche du monde des bibliothèques numériques. Il est dommage que la question de l'étude des usages ne soit pas développé, l'auteur part ici de l'offre et non de la demande. Il est en quelque sorte sous entendu que l'usager doit être formé à l'utilisation de la bibliothèque numérique, mais il aurait été important de rappeler que c'est l'outil qui doit être adapté aux usages et non l'inverse.
Un élément m'a posé problème dans ce document: « [l'usager] aura désormais accès à une quantité d'informations inimaginables », c'est vrai que cette idée fait tourner la tête, mais sera t-il possible pour lui de s'y retrouver, de passer d'une source à une autre, pourra t-il seulement en connaître l'existence?


Vendredi 27 janvier 2006

Le texte analysé ici a été édité en deux billets sur le blog de Manue.

Manue [pseudonyme]. Les joies de la déconstruction numérique. In Figoblog. Bibliothéconomie [En ligne] Disponible sur <http://www.figoblog.org/document504.php> (Page consultée le 20 janvier)

Manue [pseudonyme], Got [pseudonyme]. Les joies de la déconstruction numérique. In Figoblog. Bibliothéconomie [En ligne] Disponible sur <http://www.figoblog.org/document504.php> (Page consultée le 20 janvier)

Les auteurs

Manue, bibliothéconome est l'auteur de Figoblog un blog de veille à suivre absolument!
Got est l'auteur d'un blog de veille des NTI, mais on y trouve également des informations sur la bibliothéconomie et le monde des archives.

Les articles

Les joies de la déconstruction numérique

Manue aime bien affirmer que « le numérique change à la fois beaucoup et pas grand chose dans la manière dont on appréhende le document et la bibliothèque ». Enfin de compte la bibliothèque numérique s'inscrit dans la même ligne directrice que la bibliothèque traditionnelle, les missions et les motivations sont les mêmes. En ce qui concerne le document numérisé, il doit être fidèle au document analogique. En effet la numérisation déconstruit le document, c'est au professionnel de l'information de part les métadonnées et la structuration de l'information de permettre une substitution du document original.


Numériser ce n'est pas éditer

Les auteurs se penchent sur les questions de numérisation et d'édition et ainsi soulèvent la question: peut on dire que la bibliothèque édite lorsqu'elle numérise? Et bien justement non, elle ne doit surtout pas éditer. Elle crée certes quelque chose mais ce ne doit pas s'apparenter à une création intellectuelle. La numérisation doit se cantonner à être l'adaptation d'un support à un autre. Par cette mise en oeuvre, la bibliothèque crée une valeur ajoutée (balisage, métadonnées internes,...) mais ne doit pas modifier le contenu intellectuel du document, afin d'en conserver le sens et la forme. Tandis que le travail d'édition est un travail de création car le document n'existait pas auparavant.

Il est vrai que les taches d'édition et de numérisation utilisent les mêmes outils, mais il s'agit de deux démarches différentes: la production d'un nouveau document et la mise à disposition d'un document sous une forme différente.


Commentaire

Partir du postulat que « le numérique change à la fois beaucoup et pas grand chose dans la façon dont on appréhende le document » est assez provocateur au premier abord, et pourtant la démonstration que nous livrent Manue et Got est pertinente. Il est vrai que la bibliothéconomie ait connu de grands bouleversements avec l'arrivée du numérique. Mais les missions auxquelles nous tenons tant sont toujours d'actualité seulement de nouveaux outils sont à notre disposition pour les remplir. J'apprécie cet article car je pense qu'il remet les chose au clair, ce n'est pas à la bibliothèque de remplir le rôle de l'édition, la maîtrise des outils numériques ne doivent pas faire oublier que la mise à disposition passe par l'intégrité du document. Il est déjà tellement difficile de mettre à disposition de l'information avec neutralité. Je pense qu'il manque tout de même dans ces billets l'idée que le document numérisé ne se substitue pas totalement au document analogique, en effet le support original est également vecteur d'information, il est donc important de s'y référer.


Mercredi 25 janvier 2006
GIFFARD, Alain. Sur la Bibliothèque Numérique Européenne. In Alain Giffard culture, technologies, lecture, mémoire, hypertexte. [En ligne]. Disponible sur: <http://alaingiffard.blogs.com/culture/2005/12/> (Page consulté le 25 janvier)

L'auteur

Alain Giffard dirige la Mission interministérielle pour l'accès public à la micro-informatique, à l'Internet et au multimédia. Il est également l'auteur d'un blog sur lequel a été publié cet article.

L'article

Alain Giffard recentre la question de la création des bibliothèques numériques, il ne se perd pas dans des questions de formats, et de technologies diverses. Il aborde une question primordiale: la sélection des documents dans l'objectif de la constitution d'une collection. Il demande à ce que la logique d'une collection soit explicitée, car le document prend sens selon la collection dont il fait parti. De plus, il faudrait distinguer les bibliothèques numériques issues de bibliothèques classiques, des bibliothèques numériques issues de textes numériquement disponibles (la bibliothèque analogique correspondante n'existe pas). Les ensembles de documents numérisés à des seuls fins de gestion et de préservation ne constitueraient donc pas réellement des collections numériques.

Dans le cas de la bibliothèque numérique européenne, il s'agit de sélectionner les ouvrages que les européens reconnaissent comme les leurs, seulement il a été choisi de sommer les sélections opérées par chaque pays. Il n'y a donc pas de réelle politique commune. Selon l'auteur, cette collection européenne ne devrait pas être constituée en fonction de ce que les magasins de nos bibliothèques contiennent, mais de ce qu'elle devrait contenir y compris de documents circulant sur la Toile.

Le cas de Google Print

Contrairement à Google, Google Print ne fonctionne pas grâce à la notoriété des documents, mais grâce à l'audimat. La notion de réseau entre les documents n'est donc plus exploitée, l'auteur se demande si justement il ne serait pas intéressant de s'appuyer encore plus sur les parcours de lecture de l'internaute. L'efficacité de Google Print repose donc principalement sur la masse très importante de documents et sur la seule indexation automatique, selon l'auteur cela ne suffira pas à concevoir un outil aussi performant que Google. De plus, la coopération des bibliothèques publiques et de la société privé Google a fait couler beaucoup d'encre, mais selon Alain Giffard la véritable nouveauté de cette coopération serait la dépendance vis à vis des revenus publicitaires.
L'auteur rappelle que la société Google est là avant tout pour générer du profit et suppose que le projet Google Print sera développé dans le but de constituer une passerelle de pré-lecture avant l'achat de documents.

La mise en place de contenu en ligne pose également la question de la lecture numérique, bien peu étudiée par les industriels de l'information. La lecture en zapping serait issue de ce peu d'adaptation de l'outil à l'usager. Alain Giffard revendique le droit du lecteur: le droit à ce que la lecture lui soit facilité.


L'auteur défini les bases sur lesquelles pourraient reposer une intervention d’Ars Industrialis (Association internationale pour une politique industrielle des technologies de l'esprit):

- Une philosophie : la lecture, la lecture numérique comme une technologie dans la perspective d’une culture de soi démocratique.
- Une idée de la bibliothèque numérique : comme réseau de textes et réseau de lecteurs.
- Une perspective technique : construire les instruments techniques d’une lecture numérique ainsi conçue.
- Une proposition juridique : mettre en place un droit du lecteur.
- Un projet politique immédiat : prendre part au débat lancé par la commission européenne.

Commentaire

J'ai beaucoup aimé cet article et je remercie Alain Giffard de l'avoir publié. Il est important de ne pas oublier que la technique doit être un moyen, et que c'est loin d'être la première chose à aborder lors d'un projet de collections numériques. De plus, j'ai apprécié que la notion de collection soit rappelée. Il ne s'agit pas de montrer du doigt et de dénoncer les projets reposant sur un enjeux de gestion ou de préservation (ou commercial). Mais de distinguer une bibliothèque en tant qu'unité d'un groupe de documents numérisés ou numériques. La terminologie des différentes types de bibliothèques numériques est également intéressante à rappeler. Quelque soit l'identité du groupe de documents qu'il soit collection, ou pas il est important de mettre en avant cette identité afin que lecteur puisse aborder en toute connaissance de cause les documents.

Lundi 23 janvier 2006

GUILBA, Jean, et LAZIER, Isabelle, In Terrain, Numéro 14 - L'incroyable et ses preuves « La gestion et la communication du patrimoine ethnographique », (mars 1990), [En ligne]. Disponible sur:<http://terrain.revues.org/document2977.html> (Page consultée le 23 janvier 2006)


Les auteurs:

Jean GUIBAL est conservateur en chef du patrimoine et directeur de la Conservation du Patrimoine en Isère.

Isabelle LAZIER est conservatrice en chef du patrimoine et directrice du Musée de l'Ancien évêché de Grenoble.


L'article

Les documents issus des collections ethnographiques constituent des sources d'informations importantes pour les chercheurs, cependant ces collections sont décimées entre les différentes institutions. Une gestion informatisée doit être mise en place, elle doit permettre l'échange et le partage d'informations. Un simple travail de compilation des documents permettrait à la recherche d'élargir ses champs d'horizon.


De l'ethnologie, du patrimoine et des sources

Les auteurs nous expliquent qu'une rupture assez ancienne s'est produite dans le domaine de l'ethnologie. Ainsi l'on peut distinguer la recherche en ethnologie qui s'intéresse majoritairement à la culture « sociale » (langues, rites, symbolismes,...) et le travail en patrimoine ethnologique qui se penche sur la culture matérielle. Mais cette deuxième face de l'ethnologie doit devenir plus scientifique afin de permettre la conservation du patrimoine.

En 1968 dans un article paru dans Terrain, Daniel Fabre a exprimé son opinion sur les objets ethnographiques qui selon lui n'auraient aucun lien avec l'ethnographie comme science sociale. Selon Jean Guilba et Isabelle Lazier ces propos remettent en cause la valeur scientifique de ces objets porteurs de faits culturels, l'ethnologie repose sur leur étude celle-ci doit pouvoir être menée scientifiquement.


Les acquis antérieurs

Un projet serait à prendre en exemple, le système élaboré au musée national des Arts et Traditions populaires comporte quelques différence avec celui de Rhônes-Alpes. Les documents sont classés topologiquement et sont très finement indexés. Cet outil est trop perfectionné et ne répond pas aux besoins moins poussés des chercheurs.


De l'ethnologie en Rhônes-Alpes

En 1985, le projet d'une banque de données « de gestion et de recherche documentaire appliquée aux collections et sources ethnographiques de la région Rhône-Alpes » a été entamé. Cette banque de données devaient permettre: la gestion et la recherche documentaire ; la complémentarité des collections et des sources ethnographiques. La consultation du document original ne serait pas remplacée mais facilitée. L'unité administrative du projet a permis son succès, ainsi dix-neuf établissements ont participé à l'opération et livré des données normalisées à la banque commune. Les auteurs nous présentent les principes sur lesquels repose le projet mené en Rhône-Alpes.


La nature des objets ethnographiques est très variée, il a fallu concevoir une grille descriptive commune à tous les documents afin de ne concevoir qu'une seule base de données. De plus le système devait être très simple afin d'en permettre l'accessibilité à tous. Les objets peuvent être visualisés, la description textuel est alors limité par un lexique descriptif très simple. Les différents accès aux documents proposés permettent la consultation à un public de non spécialistes.


Méthodes et techniques

Il a fallut constituer une banque d'images représentative du patrimoine ethnographique, elle se constitue des photographies des objets et des documents images des collections (photographies, films, peintures,...).

Un lexique ayant une prétention encyclopédique est employé, il est constitué de 2 500 descripteurs, il a vocation à être complété dans les domaine de l'industrie et de l'urbanisme. La savoir faire documentaire a été appliqué par la mise en place d'une liste de synonymes avec les renvois sur les descripteurs retenus. La description géographique n'est pas pleinement satisfaisante à cause des nombreux découpages possibles: administratifs, pays, régions naturelles


Banque de données et banque d'images

Deux produits documentaires étaient donc consultables: un vidéodisque « catalogue d'images » sur le patrimoine ethnographique régional et un vidéodisque « interactif », outil de gestion et de recherche documentaire constitué des images et des données.

Le vidéodisque « catalogue d'images » peut être consulté sans le recours à la banque de donnée associé grâce à un classement thématique des documents. Mais il est important de garder à l'esprit que ce vidéodisque n'est que partiellement représentatif du patrimoine car beaucoup de documents ne sont pas reproductibles à l'image.

Le deuxième vidéodisque « interactif » était en libre consultation au Musée Dauphinois de Grenoble. A l'époque, les auteurs estimaient que son utilisation était discriminante du fait des compétences informatiques requises. Il était également envisager de mettre en place une interrogation en ligne.


Commentaire

Il est vrai que ce texte ne parle pas des collections numériques, mais il apporte des réponses au questionnement sur la gestion du patrimoine. Les solutions mises en place à l'époque relève de l'envie de donner une dimension plus scientifique à la gestion des objets porteurs d'un fait culturel. Il s'agit de l'application du savoir faire scientifique notamment documentaire. Cependant il est intéressant de voir, que la notion d'accessibilité reste au premier rang. Les outils proposés sont normalisés et simplifiés afin d'être utilisés par des publics scientifiques ou non.

Cependant, nous pourrions nous poser la question de savoir, si la base de donnée ainsi constituée répond réellement aux usages? Malheureusement il n'existe plus aujourd'hui de lecteur pour l'utiliser, le transfert des données sur un autre support serait en projet. L'obsolescence des supports ne facilite pas la conservation des données numériques, un détail regrettable pour un projet de cette envergure.

dépot nom de domaine sur over-blog.com - Contact - C.G.U. - Rémunération en droits d'auteur avec TF1 Network - Signaler un abus