Catégorie : Archivistique, archives
-
vEADette: une ébauche d’application d’audit et d’indexation des instruments de recherche pour les archivistes
vEADette est une ébauche d’application d’indexation automatique et d’audit des instruments de recherche en XML/EAD. Automatique car l’analyse et l’extraction sémantique emploie un LLM pour l’analyse de corpus d’instruments de recherche; et contrôlée car la génération des données repose sur l’emploi du vocabulaire fixé par les thésaurus réglementaires et les notices d’autorité permettant à la…
-
Un K à part. La série départementale des publications officielles, lois, ordonnances et arrêtés
Je travaille actuellement pour le projet Mezanno à la Bibliothèque nationale de France (BnF) et l’EPITA, dédié à l’annotation automatique de documents sériels numérisés et à l’extraction de données structurées. Dans ce contexte, je travaille sur une méthodologie d’évaluation des données générées à partir du Journal Officiel (J.O.) disponible sur Gallica. Si je ferai prochainement…
-
Le fonds Henri Brocard sur Calames
J’ai travaillé en tant qu’archiviste l’été dernier au classement du fonds Henri Brocard à l’Institut Henri Poincaré sous la direction du responsable du centre de documentation. Bref retour sur ce traitement qui aura duré quatre (petits) mois et qui m’aura permis d’expérimenter mes propres outils de génération semi-automatique d’un instrument de recherche en XML avec…
-
XML/EAD : bénéficier de la validation DTD sans Oxygen XML Editor
La réalisation d’instrument de recherche en XML/EAD, et plus généralement l’utilisation de XML et d’une grammaire, exige de vérifier si son document est bien valide au regard d’une DTD. Dans le monde des archives, il est courant d’utiliser la DTD de 2002. L’encodage d’un instrument de recherche en XML se fait donc sous le contrôle…