EPISTEMON - Corpus de textes de la Renaissance icone corpus Epistemon

Les premiers textes de la base « Epistemon » ont été mis en ligne en 1998 à l’Université de Poitiers, puis à l’université François-Rabelais de Tours (Centre d’Etudes Supérieures de la Renaissance) dès 2001.

La première base a d’abord offert des textes transcrits et publiés au format html avec des modifications minimales, comme pour le corpus « Rabelais » publié en ligne depuis 1995 par Etienne Brunet et Marie-Luce Demonet sur le site Rabelais de l’Université de Nice, maintenant inactif.

Le programme BVH dans sa première phase a offert les fac-similés d’ouvrages de la Renaissance, dont certains déjà transcrits, d’autres en cours de transcription. La transcription dite « patrimoniale » permet un traitement linguistique minimal, d’abord effectué sous TactWeb à Toronto (par Russon Wooldridge) et actuellement offert sous Philologic (grâce à Mark Olsen, Timothy Allen, Université de Chicago, et Jorge Fins, CESR).

L’utilisation du langage XML avec les recommandations de la TEI (ici TEI-« Renaissance », disponible dans le Manuel d’encodage en ligne - Mis à jour le 9 octobre 2017, version 4 ) offre le résultat d’une standardisation qui s’est stabilisée après des années d’expérimentation par le consortium TEI. Cette procédure de transcription encodée est mise en œuvre dans le projet BVH depuis 2007 : les nouveaux textes sont balisés selon cette application et les anciennes versions sont progressivement reprises, ce qui permet :

  • la recherche sur les éléments de structure et les régularisations sous l'outil PhiloLogic paraméré spécialement pour Epistemon depuis 2009.
  • Cette recherche est également possible à partir du moteur XTF qui permet l'indexation et la visualisation des ressources textuelles des BVH (corpus Epistemon mais aussi des PDF avec OCR bruts du corpus Fac-similés).
  • Les textes d’Epistemon encodés en TEI sont aussi interogeables sous l'outil TXM. Cette plateforme, développée par Serge Heiden (laboratoire IHRIM, Équipe CACTUS, ENS Lyon) pour les textes médiévaux).

Les informations complètes sur la nature et les auteurs de la transcription sont contenues dans le "header" de la version en TEI (accessibles en ligne depuis septembre 2011 avec la nouvelle version du moteur XTF).

De part le contenu d'Epistemon intégrant notamment les corpus d'auteurs Rabelais et Montaigne, les BVH s'inscrivent dans le consortium Corpus d'auteur CAHIER (Corpus d'Auteurs pour les Humanités : Informatisation, Édition, Recherche), consortium de littérature et de philosophie dont le CESR a été l'initiateur et le porteur jusqu'en 2013. Labelisé en septembre 2011 par la TGIR Corpus (fusionné depuis au TGE Adonis pour devenir en 2013 : Huma-Num, la TGIR des humanités numériques), le consortium est désormais géré par la MSH Val de Loire.

logo TGIR Huma-Num

> Liste complète des publications en XML/TEI

> Textes publiés en HTML

> Textes transcrits ou en cours d'encodage


Marie-Luce Demonet, 25 juillet 2012
Dernière mise à jour : 3 novembre 2017