WKT News Archiv

DEMel-Belegzettel und ihre Quellen: Ein Anwendungsfall für automatische Texterkennung

Das Diccionario del Español Medieval electrónico (DEMel) ist eine lemmatisierte Datenbank zum mittelalterlichen Spanisch. Sie ist aus der Digitalisierung und Erschließung von rund 700.000 Belegzetteln entstanden. Diese überwiegend handschriftlichen Belege zeigen Auszüge aus altspanischen Texten, in denen das zu untersuchende Wort vorkommt, und dokumentieren somit seine Verwendung und Bedeutung im 10. bis 15. Jahrhundert.

Seit 2016 wird das DEMel-Projekt unter Leitung von Prof. Rafael Arnold von der Deutschen Forschungsgemeinschaft gefördert. An der Universität Rostock ist es am Institut für Romanistik, der Universitätsbibliothek Rostock sowie am Institut für Germanistik/ Lehrstuhl für Digital Humanities angegliedert.

In der aktuellen Projektphase sollen die von den Zetteln erfassten Wortbelege mit ihren Quellentexten verknüpft werden. Dafür werden die im digitalen Volltext verfügbaren Quellen in XML/TEI konvertiert und die Belege darin ausgezeichnet.

Wie durch den Einsatz von Texterkennungssoftware die Belegauszeichnung weitgehend automatisiert werden kann, erläutert am Montag, den 8. Januar 2024 um 17.15 Uhr die Koordinatorin des DEMel-Projekts, Caroline Müller. Dabei wird sie auf die Erfahrungen mit den verwendeten Softwares zur Texterkennung – Transkribus und Tesseract – eingehen und erste Ergebnisse zu Evaluation des Workflows geben.

Der Vortrag im Rahmen der Ringvorlesung "Digital Humanities im Fokus" findet im Hauptgebäude der Universität/ Raum 104 (1. OG) sowie gleichzeitig online via Zoom statt.

Details