Automatische herkenning bij Fotopersbureau De Boer

Automatische trefwoorden

Met kunstmatige intelligentie is het mogelijk om een computer te laten bepalen welk onderwerp het beste past bij een foto (beeldherkenning). In historische fotocollecties zijn vaak specifieke onderwerpen vastgelegd, zoals een ‘demonstratie’, ‘honkbalwedstrijd’ of ‘winkelstraat’. Samen met ons publiek hebben wij een computerbrein getraind om dit soort onderwerpen met kunstmatige intelligente automatisch te herkennen. De resultaten daarvan vind je terug via ‘automatische trefwoorden’.

Het levert een handige zoekoptie op. Er zijn meer doorzoekbare gegevens en de foto’s worden in bulk naar onderwerp gecategoriseerd. Dat is bijvoorbeeld handig als je het veranderd beeld van winkelstraten of sinterklaasvieringen door de tijd heen wilt zien of onderzoek doet naar demonstraties. De computer maakt niet altijd een juiste inschatting, maar al wel goed genoeg om van nut te zijn bij het doorzoeken van de collectie van Fotopersbureau De Boer. Het getrainde computerbrein is gratis beschikbaar voor iedereen. Het kan dus ook worden toegepast op andere beeldcollecties, zelfs als deze geen verdere doorzoekbare gegevens bevatten.

Bij de filter ‘automatische trefwoorden’ vind je alle onderwerpscategorieën. Als je op een foto klikt, dan zie je linksonder de gevonden categorieën met het waarschijnlijkheidspercentage, de mate van zekerheid volgens de computer. Als de computer bijvoorbeeld 80% zeker is dat het om een ‘voetbalwedstrijd’ gaat, is er ook 20% kans dat de foto eigenlijk thuishoort in één van de andere categorieën. De computer geeft ook een inschatting of een foto binnen of buiten is genomen.

Op dit moment zijn al de deelcollecties vlakfilms, 6x9 rolfilms en glasnegatieven doorzoekbaar op onderwerpscategorieën. We streven ernaar om alle twee miljoen foto’s op deze manier doorzoekbaar te maken. Ook willen we een sorteeroptie toevoegen waarin je jouw zoekresultaat kan ordenen op de mate van waarschijnlijkheid. Dan krijg je bijvoorbeeld eerst foto’s te zien waarvan de computer 99% zeker is dat het om voetbalwedstrijden gaat.

De lijst met alle onderwerpscategorieën en hun omschrijvingen is hier te bekijken.

Van deze foto is de computer 71% zeker dat het om ‘Kermis’ gaat, maar het zou ook een foto van een ‘Circus’ (15%) kunnen zijn. De computer is er bovendien zeker van dat deze foto zich buiten afspeelt en niet binnen.

Automatische tekstherkenning

Kunstmatige intelligentie maakt het mogelijk om teksten die voorkomen op foto’s op te sporen en op geautomatiseerde wijze om te zetten in doorzoekbare tekst. Dit gaat niet perfect, want de teksten zijn niet altijd goed te zien, staan schuin of de computer heeft moeite om de juiste letters te vinden. Maar het gaat wel goed genoeg om een toegevoegde waarde te zijn voor speurders.

Als je op een foto klikt, dan zie je links onderaan de gevonden teksten onder de kop ‘automatische tekstherkenning’.

Op dit moment zijn al de deelcollecties vlakfilms, 6x9 rolfilms en glasnegatieven doorzoekbaar op teksten. We streven ernaar om alle twee miljoen foto’s op deze manier doorzoekbaar te maken.

Voorbeeld tekstherkenning