BnF : Atelier en vioconférence Data Lab "Transcription des écritures manuscrites"

Descriptif de l’atelier :
- La transcription de l’écriture manuscrite constitue l’un des enjeux du travail de recherche et d’exploitation des collections numérisées : temps de traitement long, difficulté à industrialiser les procédés, question autour de la valorisation et du devenir des corpus transcrits. Face à ces questionnements, deux solutions semblent émerger :
- La transcription collaborative sur des plateformes ouvertes à des contributeurs bénévoles participant à la transcription (et parfois à l’encodage) des manuscrits ;
- La transcription automatique, qui utilise les techniques de reconnaissance d’image issues de l’IA (dit HTR : Handwritten Text Recognition), ou la transcription semi-automatique qui utilise le participatif pour corriger et annoter les documents en post traitement.

La BnF, en tant qu’institution patrimoniale et acteur de la recherche se pose également la question de solutions de transcription, qu’elle soit sous forme de plateforme participative, ou d’outils mis à la disposition des usagers pour traiter leurs corpus. A l’heure où les technologies semblent atteindre un certain niveau de maturité, d’autres questions viennent alors : comment fédérer une communauté autour d’une plateforme ; comment verser ces transcriptions dans les outils déjà existants ; comment accompagner les chercheurs sur ces nouveaux outils ?
A travers la présentation d’outils et de projet de recherche, cet atelier vise deux objectifs principaux :
partager les résultats de la recherche et fédérer une communauté d’usagers autour des outils qui seront mis à disposition dans le BnF DataLab ;
acculturer les acteurs aux traitements automatisés sur des collections qui jusqu’à présent échappaient à l’analyse de masse (manuscrits, tapuscrits, imprimés anciens, écritures non latines, etc.).

Pour participer à l'atelier nous vous invitons à vous inscrire via ce lien : https://www.eventbrite.fr/e/billets-atelier-data-lab-transcription-decri...

DÉROULÉ DE L'ATELIER :
15h - Introduction générale de l’atelier / accueil des participants par Marie Carlin

1ER PARTIE : TRANSCRIPTION COLLABORATIVE
15h05 : Jean-Philippe Moreux, BnF, expert scientifique Gallica : Introduction : les projets de transcription collaborative et de correction d’OCR à la BnF.
15h15 : Pauline Charbonnier, Archives nationales, ingénieur d’études : Présentation du projet de plateforme collaborative Testament de poilus1.
15h30 : Vanessa Desclaux, BnF, conservatrice au service des manuscrits orientaux et Anais Wion, CNRS, chargée de recherche : Les manuscrits d’Abbadie et la plateforme Transcrire2.
15h45 : Questions

16h : PAUSE

2E PARTIE : HTR
16h15 : Emmanuelle Bermès, BnF, adjointe chargée des questions scientifiques et techniques auprès du Directeur des services et des réseaux : Introduction.
16h25 : Daniel Stökl Ben Ezra, EPHE, PSL, UMR 8546 AOrOc : Présentation de l’infrastructure HTR open source eScriptorium3.
16h40 : Alix Chagué, INRIA, ingénieure recherche et développement et Aurélia Rostaing, Archives nationales, conservatrice du patrimoine : présentation d’escriptorium et du projet Lectaurep4(Lecture automatique de répertoires)"
16h55 : Dominique Stutzmann, CNRS-IRHT, chargé de recherche : présentation de l’ANR Horae5.
17h10 : Questions
17h30 - Conclusion générale : Arnaud Larborderie

Date: 
Mardi, 26 Janvier, 2021 - 15:00 - 17:30

Type d'événement: