Menu

Zoekintranscripties.nl nu al beschikbaar gesteld voor publiek

Tijdens het Symposium De IJsberg zichtbaar maakten lanceerde het Nationaal Archief de website zoekintranscripties.nl. Op deze website kunnen bezoekers handgeschreven bronnen – veelal moeilijk leesbaar – bekijken en doorzoeken. Dit is mogelijk, omdat deze bronnen met behulp van transcriptietechniek machineleesbaar zijn gemaakt, en zijn verrijkt met behulp van kunstmatige intelligentie. Dit is een innovatie voor het archiefonderzoek. Tijdrovend archiefonderzoek kan nu veel sneller plaatshebben, locatieonafhankelijk en dat biedt grote kansen voor historisch onderzoek.

Op dit moment zijn er 1,5 miljoen transcripties te bekijken op zoekintranscripties.nl. 90.000 daarvan zijn verrijkt en doorzoekbaar. Het is een eerste resultaat dat nu al aangeboden wordt aan het publiek. De verwachting is dat deze zomer 2 miljoen verrijkte transcripties doorzoekbaar zijn op deze website. Het gaat om historische handgeschreven documenten van de VOC uit de 17e en 18e eeuw en notariële archieven uit de 19e eeuw van het Noord-Hollands Archief en andere Regionaal Historische Centra. Zoekintranscripties.nl is qua inhoud en gekozen techniek waar mogelijk open source en bruikbaar voor andere erfgoedinstellingen.

Interessante vondsten in schat aan data

Tijdens het project De IJsberg zichtbaar maken zijn steeds transcripties toegevoegd aan Zenodo.org, een website voor open data. Diverse onderzoekers en historici gingen er al aan de slag met deze schat aan data. Gerhard de Kok, universitair docent koloniale geschiedenis van de Universiteit Leiden, maakte bijvoorbeeld een zoekinterface en deed interessante vondsten in de automatisch getranscribeerde archiefstukken.

Zwijgende getuigen krijgen een stem

Ook schreven Noord-Hollands Archief en Nationaal Archief de ‘Innovatie in Archief’-onderzoek prijs uit. Het doel hiervan was studenten en onderzoekers uit te dagen te laten zien welke nieuwe onderzoeksmogelijkheden deze data bieden. De jury kende de prijs toe aan Saskia Virginia Noot, Clare Shutt en Thijs Vorstenburg, studenten van de UVA. Zij gaven vrouwen en tot slaafgemaakten in de VOC-testamenten een stem door gebruik te maken van automatische transcripties van testamenten.

De IJsberg zichtbaar maken

In dit project werkt het Nationaal Archief samen met het Noord-Hollands Archief en andere Regionaal Historische Centra. Het projectresultaat is dat een grote hoeveelheid historische documenten met behulp van kunstmatige intelligentie automatisch getranscribeerd, oftewel omgezet in machine leesbare tekst. Ter gelegenheid van de afsluiting van het project was er het symposium De IJsberg zichtbaar maken, over de resultaten van het project over automatische handschriftherkenning.

Bekijk hier het symposium terug:

Betrokken partijen website

Voor de selectie van leveranciers voor de doorontwikkeling is een aanbestedingsprocedure uitgevoerd. Picturae bleek de beste partij voor de ontwikkeling van de achterkant van de projectwebsite. Picturae is een bekende in de erfgoedwereld met onder andere producten als het crowdsourcing platform Vele Handen en digitalisering van archieven. Ze zijn verantwoordelijk voor de verbetering en modernisering van de transcripties, het toekennen van entiteiten en het ontwikkelen van een transcriptie beheersysteem.

Sioux Technologies is als onderaannemer aangesloten voor de kunstmatige intelligentie. Aincient is betrokken vanwege de kennis van kunstmatige intelligentie, het erfgoedveld en projectmanagement.

Clean Code ontwikkelde de voorkant van de projectwebsite, inclusief de inrichting van de zoekmachine. Clean Code is een klein, innovatief bedrijf uit Amsterdam dat zich richt op user interfaces en data analyse. De expertise van onderaannemer Duizendvijftig is het grafisch ontwerp en het coderen.