Furthermore, we examine how specific characters, diacritics, and ligatures affect performance. These findings provide recommendations to ensure more accurate and efficient creation of future models and ultimately to enhance the digital preservation of medieval Icelandic manuscripts.
This process allows us to identify the specific limitations by comparing the ground truth to generated transcriptions of contemporary manuscripts. Our results highlight how parchment quality, contrast and large initials influence the accuracy of the recognition model.
To reveal the precise challenges of automated transcription, we discuss the process of custom-training a Transkribus model for 13th-century Icelandic based on the manuscript AM 519 a 4to (c1280). We then use digital tools for comparison and analysis of insertions, deletions, and substitutions.
HTR technology offers a revolutionary path toward mass accessibility. This paper addresses the current lack of readily available digital infrastructure by evaluating HTR’s performance on the Old Icelandic corpus.
How can we make Handwritten Text Recognition (HTR) a viable tool for the transcription of Old Norse-Icelandic medieval manuscripts? While digitisation of Old Norse-Icelandic literary heritage has so far relied on high-quality photography or labour-intensive XML encoding,
Katrín Lísa L. Mikaelsdóttir (@vanlinduist.bsky.social), Alice Heeley and Martin Roček (@martin.rocek.dev)
Mind the Gap: Where HTR Models Excel and Fail in Old Icelandic Transcriptions
📍 Árnagarður 303 📅 March 14, 13:00
hugvis.hi.is/is/velraenn-textalestur-stada-og-horfur-fyrir-islensku
Útkoman er yfirgripsmikið textasafn sem gerir fjölda texta aðgengilega til rannsókna í stafrænum hugvísindum og víðar, sem hluti af Málheild síðari alda.
Í þessu erindi fjöllum við um prentaðar bækur í Landsbókasafni frá þessu tímabili sem hafa allar verið ljóslesnar og munu verða meginefniviður væntanlegrar málheildar. Þessa texta alla þarf að ljóslesa, tilreiða, samræma til nútímastafsetningar og greina málfræðilega.
Ógrynni texta er varðveitt frá tímabilinu og þeir eru misaðgengilegir til útgáfu í málheild. Hingað til hefur ljóslestur reynst of lélegur og handvirkar leiðréttingar of dýrar og tímafrekar til að hægt hafi verið að gera slíka texta aðgengilega en nú hillir undir að það verði hægt.
Málheild síðari alda er væntanleg, málfræðilega mörkuð málheild sem inniheldur íslenska texta allt frá siðaskiptum til aldamótanna 1900. MSA er unnin að miklu leyti með ljóslestraraðferðum en að verkefninu standa Stofnun Árna Magnússonar, Landsbókasafn-Háskólabókasafn og Þjóðskjalasafn Íslands.
Hinrik Hafsteinsson og Margét Jóna Gísladóttir
Illum geymir, ef aldrei nýtur - Ljóslestur prentaðra bóka í Málheild Síðara Alda
📍 Árnagarði 303 📅 14. mars, kl. 13:30
hugvis.hi.is/is/velraenn-textalestur-stada-og-horfur-fyrir-islensku
The presentations will cover the use of machine reading to expand the Icelandic Gigaword Corpus and experiments in using HTR to read medieval manuscripts. The projects presented have been supported by MSHL and the Infrastructure Fund. 4/4
In Iceland, Optical Character Recognition (OCR) has long been used for printed material, while models for Handwritten Text Recognition (HTR) for Icelandic are a more recent development. This session will present new experiments using OCR and HTR to process texts. 3/4
Technology for the machine reading of handwritten documents and printed text has advanced significantly in recent years, increasing the potential to make much larger volumes of text digitally accessible and searchable than before. 2/4
We are hosting a session at Hugvísindaþing!
📍 Árnagarður 303 📅 March 14, 13:00
Machine Reading of Icelandic Texts – Status and Prospects
How can we utilise the latest technology in OCR and HTR to digitise Icelandic cultural heritage?
About the session: tinyurl.com/5cjz2fuf
Erindin munu fjalla um ljóslestur prentmáls og handritalestur til að stækka og víkka út íslenska málheild, og um tilraunir til að nota vélrænan handritalestur til að lesa eldri handrit. Verkefnin sem verða kynnt hafa verið unnin með stuðningi MSHL og með styrkjum úr Innviðasjóði. 4/4
en þróun líkana til að lesta handrituð skjöl (e. HTR – Handwritten Textual Recognition) er styttra komin. Í þessari málstofu verða kynntar nýjar tilraunir til að nota ljóslestur og vélrænan handritalestur – í sitt hvoru lagi eða saman – til að vinna með texta. 3/4
Tækni til að lesa með vélrænum hætti handrituð skjöl og prentaðan texta hefur þróast mikið undanfarin ár og þar með möguleikum til að gera mun stærra textamagn en áður tölvutækt og leitarbært. Á Íslandi hefur ljóslestur (e. OCR – Optical Character Recognition) prentmáls lengi verið notaður, 2/4
Við erum með málstofu á Hugvísindaþingi!
📍 Í Árnagarði 303 📅 14. mars, kl. 13
Vélrænn textalestur – staða og horfur fyrir íslensku
Hvernig getum við nýtt nýjustu tækni í ljóslestri (OCR) og handritalestri (HTR) til að gera íslenskan menningararf tölvutækan?
Um málstofu: tinyurl.com/5cjz2fuf
Ever wanted to get started with the SSHOC Open Marketplace but didn't know where to begin?
Join us for the second webinar in this 2026 training series: "Introduction to the SSHOC Open Marketplace" 🤗
📅 20th March
➡️ Register: docs.google.com/forms/d/e/1F...
Fyrirlestraröð #LunchwithDH 🌐🧩
Eiríkur Smári Sigurðarson, MSHL, Háskóli Íslands
"Tengjum allt við allt"
📅 Þriðjudaginn, 17. mars 2026, kl. 12:00 GMT
📍 Veröld VHV-208 & á YouTube @MSHLIceland
Applications close in 1 week for the ATRIUM Summer School 2026 "From Maps to Data and Data to Maps: Exploring Spatial Histories", taking place in Athens, Greece from June 29–July 2, hosted by Athens University of Economics & Business🇬🇷
🔸 Find out more & apply here: atrium-research.eu/news/call-fo...
TOMORROW: All are welcome to our #FridayFrontiers webinar! 🥳
'“Can this be done?” New research tools for studying human interaction', with speakers: Stefan Lindgren & Carolina Larsson from Lund University🎭️
➡️ Register: www.dariah.eu/2026/02/12/f...
Starf í boði! 💾
Laust er til umsóknar, fullt starf verkefnisstjóra í gagnaumsýslu hjá GAGNÍS, varðveislusafn fyrir rannsóknargögn á Íslandi. Hlutverk gagnaþjónustunnar er að taka við gögnum til varðveislu og birtingar í opnum aðgangi eftir alþjóðlegum gæðaviðmiðum.
island.is/starfatorg/x-45698
TODAY - 🎥🔴
Alexander Peter Pfaff, University of Iceland
"How Many Ways Can You Say It? Measuring Language Diversity with Digital Methods"
youtube.com/live/102UIXOzdz8?feature=share
More about the Lunch with Digital Humanities lecture series:
mshl.is/vidburdir/lunch-with-dh
Exciting news! @vanlinduist.bsky.social & @eirikursmari.bsky.social's paper “Engaging the Fragmented Archive: A Unified Portal for Icelandic Cultural Heritage” has been accepted for #DH2026
We are looking forward to sharing our work on unifying Icelandic heritage data. See you all in Daejeon!
Exciting news! @vanlinduist.bsky.social & @eirikursmari.bsky.social's paper “Engaging the Fragmented Archive: A Unified Portal for Icelandic Cultural Heritage” has been accepted for #DH2026
We are looking forward to sharing our work on unifying Icelandic heritage data. See you all in Daejeon!
What’s new in #DH Iceland? Our March spotlight is out! ✨
Our lecture series, Lunch with Digital Humanities, continues on Tuesday, and we host a session on #HTR and #OCR at the annual conference of the University of Iceland School of Humanities.
Link in the comments 👇