Projet CRII (Catalogues Régionaux des Incunables Informatisés)

Informatisation des Catalogues régionaux des incunables

Depuis la parution du premier volume des Catalogues régionaux des incunables des bibliothèques publiques de France (1979), 15 autres volumes sont aujourd'hui parus et 14 volumes sont en cours de production, sous la coordination scientifique (depuis 1992), de Pierre Aquilon, maître de conférences honoraire de l'université François-Rabelais de Tours et sous la tutelle du Ministère de la Culture et de la Communication, Service du Livre et de la Lecture (SLL).

Pour améliorer le signalement des collections d'incunables, le SLL a d'abord demandé au CESR de mener une étude de faisabilité du projet, en coordination notamment avec la Bibliothèque nationale de France et la Bibliothèque Sainte-Geneviève, pour définir un modèle de structuration des données. Un groupe de travail, coordonné par Florent Palluault (MCC-SLL), s'est rapidement réuni sur ce projet, et une journée de concertation avec d'autres catalogues européens d'incunables (ISTC, GW, BSB-ink, CERL-MEI, etc.) a pu être organisée, au CESR, le 18 novembre 2010.
  > Consulter les actes

L'objectif du projet est la diffusion en ligne, gratuite, d'un catalogue interopérable, rassemblant l'ensemble des données des CRI et enrichi de liens vers d'autres catalogues ou fac-similés d'incunables en ligne, grâce à nos collaborations européennes.

Plus qu'une simple rétroconversion, il s'agit d'informatiser les Catalogues régionaux des incunables (CRI) en regroupant les descriptions d'exemplaires sous une même notice d'édition. Après confrontation des schémas proposés en XML (TEI, EAD, MARC et format spécifique au projet), le choix s'est finalement porté sur un schéma mixte : une structuration générale en XML-MARC Xchange, intégrant des éléments TEI pour un balisage fin. La plupart des caractères spéciaux seront codés en UNICODE, ou, à défaut de standard disponible, suivant les recommandations MUFI ou d'un code spécifique au projet, dans l'attente d'une proposition d'enrichissement du standard.

Sur les 16 volumes publiés des CRI et concernés par le projet d'informatisation, 9 volumes ont fait l'objet d'une numérisation et ont été passés à l'OCR. Au total, c'est un ensemble de plus de 13 250 notices à informatiser, ce qui nécessitait le développement d'un outil spécifique de catalogage.

Développement de KOHA (en cours)

Pour réaliser ce projet de rétroconversion, l'équipe des BVH a voulu se doter d'un outil professionnel adapté : après étude, le choix s'est porté sur le logiciel KOHA.
Le SIGB (système intégré de gestion de bibliothèques) Koha est un logiciel libre à la pointe des normes et standards les plus avancés pour la gestion documentaire ; son statut d'open source permet, de plus, de développer et de personnaliser ses fonctionnalités de base pour les adapter aux besoins spécifiques.
Comme il s'agit d'incunables, documents très particuliers, les besoins spécifiques sont nombreux et le travail de préparation du logiciel important :

  • Koha accepte nativement le langage XML, ce qui a permis, en développant des feuilles de transformation XSLT, de traiter aussi bien les formats de catalogage UNIMARC que MARC21, d'importer ou exporter des données d'origines diverses ;
  • Après réflexion sur la norme de description des incunables, nous avons pu créer des grilles de catalogage spécifiques ;
  • En exploitant les possibilités de l'environnement XML, nous avons développé - sous forme de boutons - une fonctionnalité d'insertion de balises TEI pour marquer le contenu des notices bibliographiques.

Cette version personnalisée de Koha nous permettra non seulement de réduire considérablement la durée de rétroconversion de notices existantes, mais elle pourra aussi être utilisée pour la production des notices des futurs volumes des Catalogues régionaux des incunables des bibliothèques publiques de France.

Marie-Luce Demonet, Laetitia Bontemps et Enrico Cima, 17 avril 2012.