J’ai conclu la dernière vidéo avec une commande qui a permis d’obtenir, dans un fichier txt, la transcription d’une image. C’était l’occasion de vérifier à la fois que kraken et nos modèles étaient bien installés et utilisables. Dans cette deuxième vidéo, nous allons voir l’anatomie d’une ligne de commande kraken et, pour ce faire, connaître le paysage global des processus sous-jacent à l’OCR ou HTR. Car à chaque chaque partie de la commande, représentées ici par une couleur, correspond, un processus (et des entrées/sorties).
Lien du programme en js pour la visualisation des données issues de la segmentation : https://editor.p5js.org/desireesdata/sketches/Hh7hflOZv
Voir la partie 1 : https://desireesdata.fr/tutoriel-prise-en-main-de-kraken-episode-1/
Documentation kraken
kraken --help
# Doc relative aux sous commandes :
kraken segment --help
kraken ocr --help
Entrées, sorties
L’enjeu principal d’un projet d’OCR est d’extraire d’une ou plusieurs images (ce sont les entrées) du texte (c’est notre sortie). Et si possible du texte structuré et enregistré dans un fichier que l’on pourra utiliser pour tel ou tel usage: ainsi, au lieu d’avoir une sortie brute au format txt, on pourrait générer un format XML.
