Catégorie : Données
-
Déblais et remblais textuels. Sur l’évaluation de la sortie structurée des LLMs pour des tâches d’indexation documentaire avec le transport optimal (1/2?)
On peut utiliser des modèles génératifs pour indexer — et donc extraire a posteriori — le contenu de textes en les interrogeant et en les contraignant avec de la sortie structurée ou de la génération structurée. Mais il peut y avoir du sable dans l’engrenage : les LLMs peuvent se tromper par exemple en oubliant d’indexer…
-
Desiderata, désirées data
Desiderata, désirées data. Voici un jeu de mots qui exprime la ligne éditoriale de ce blog sur les aspects techniques et patrimoniaux des archives — et en particulier des données. En guise d’ouverture, je propose donc d’étayer quelques problématiques insignes soulevées par cette quasi-contrepèterie (quasi, car la grivoiserie lui fait défaut). Les « désidératas » ce sont…