EPISTEMON - Corpus de textes de la Renaissance icone corpus Epistemon

Les premiers textes de la base « Epistemon » ont été mis en ligne en 1998 à l’Université de Poitiers, puis à l’université François-Rabelais de Tours (Centre d’Etudes Supérieures de la Renaissance) dès 2001.

La première base a d’abord offert des textes transcrits et publiés au format html avec des modifications minimales, comme pour le corpus « Rabelais » publié en ligne depuis 1995 par Etienne Brunet et Marie-Luce Demonet sur le site Rabelais de l’Université de Nice, maintenant inactif.

Le programme BVH dans sa première phase a offert les fac-similés d’ouvrages de la Renaissance, dont certains déjà transcrits, d’autres en cours de transcription. La transcription dite « patrimoniale » permet un traitement linguistique minimal, d’abord effectué sous TactWeb à Toronto (par Russon Wooldridge) et actuellement offert sous Philologic (grâce à Mark Olsen, Timothy Allen, Université de Chicago, et Jorge Fins, CESR).

L’utilisation du langage XML avec les recommandations de la TEI (ici TEI-« Renaissance », disponible dans le Manuel d’encodage en ligne) offre le résultat d’une standardisation qui s’est stabilisée après des années d’expérimentation par le consortium TEI. Cette procédure de transcription encodée est mise en œuvre dans le projet BVH depuis 2007 : les nouveaux textes sont balisés selon cette application et les anciennes versions sont progressivement reprises, ce qui permet la recherche sur les éléments de structure et les régularisations via "la recherche par mot" sous PhiloLogic. Cette recherche est également possible à partir du moteur XTF qui permet l'indexation et la visualisation des ressources textuelles des BVH (corpus Epistemon et PDF avec OCR bruts du corpus Fac-similés).

Les informations complètes sur la nature et les auteurs de la transcription sont contenues dans le "header" de la version en TEI (accessibles en ligne depuis septembre 2011 avec la nouvelle version du moteur XTF).

Les textes d’Epistemon encodés en TEI sont aussi testés sur la plateforme TXM, développée par Serge Heiden (laboratoire ICAR, ENS Lyon) pour les textes médiévaux (Ex. : Queste du Graal).

De part le contenu d'Epistemon intégrant notamment le corpus Rabelais et bientôt le corpus Montaigne, le CESR s'inscrit désormais dans le consortium Corpus d'auteur CAHIER (Corpus d'Auteurs pour les Humanités : Informatisation, Edition, Recherche), consortium de littérature et de philosophie dont il est le porteur, labelisé en septembre 2011 par la TGIR Corpus, fusionné depuis au TGE Adonis pour devenir en 2013 : Huma-Num, la TGIR des humanités numériques.

logo TGIR Huma-Num

> Liste complète des publications en XML/TEI

> Textes publiés en HTML

> Textes transcrits ou en cours d'encodage


Marie-Luce Demonet, 25 juillet 2012
(mise à jour : 10 juillet 2013)