Tekoäly ja kuvantunnistus sukututkimuksessa

04.09.2025

ChatGPT, AI ja muut tekoälyyn liittyvät sanat ja termit ovat nykyään esillä lähes kaikkialla ja tekoälyn käytöstä puhutaan päivittäin, paljon myös sukututkimuksessa. Me myös käytämme tekoälyä hyödyntäviä sovelluksia normaalissa arjessa ja usein myös käyttäessämme esimerkiksi arkistolähteitä.  

Tekoäly helpottaa monella tavalla myös sukututkimuksen tekemistä, mutta siihen liittyy myös useita riskejä ja huomioitavia asioita. Keskityn tässä tekoälyn hyödyntämiseen kuvien tuottamisessa, muokkaamisessa ja kuvantunnistuksessa. 

Olemme vähintäänkin nähneet tekoälyllä tuotettuja kuvia ja ehkä tehneetkin niitä itse. Monessa kaupallisessa sovelluksessa ja myös ilmaisohjelmistoissa on helppo esimerkiksi värittää vanhoja kuvia tai korjailla niitä. Hyvin tehdyt vanhojen mustavalkokuvien värittämiset voivat lisätä mielenkiintoa kuvia kohtaan ja vaikka itse katson mieluummin alkuperäisiä kuvia, niin kieltämättä väritetyt kuvatkin ovat hienoja. 

Tekoälyllä väritettyihin kuviin kuten toki itse käsin tehtyihin värityksiinkin liittyy kuitenkin mahdollisia ongelmia. Oliko esimerkiksi kuvan henkilöllä ollut paita varmasti kellertävä vai olisiko se ollutkin ehkä sininen? Kuvista saatu mielikuva jää herkästi elämään, joten väritettyjä kuvia katsoessa on hyvä muistaa, että valitut värit ovat mahdollisuuksia. Toki osasta mustavalkoisia kuvia myös tekoäly voi suurella varmuudella esittää, että väri on erittäin todennäköisesti ollut juuri se valittu, esimerkiksi jonkun yrityksen logo. 

Ongelmallisemmaksi esimerkiksi tutkimuksen luotettavuuden kannalta tilanne muuttuu, kun teemme tekoälyn avulla kokonaan uusia kuvia. Erilaisilla tekoälytyökaluilla kuvien tekeminen on helppoa, nopeaa ja halpaa ja kokeiluna ja harrastuksena täysin ok. Mutta kun näitä kuvia käytetään esimerkiksi julkaisujen kuvituksena, niin liikutaan jo riskialueella. 

Tein tätä havainnollistamaan tekoälyohjelmalla tehdyn kuvan, jonka tiedoiksi annoin minulla olevat perustiedot 1860-luvulla eläneistä esivanhemmistani. He muuttivat 34-vuotiaina huhtikuussa 1866 Länsi-Suomesta Sortavalan maalaiskuntaan 6- ja 4-vuotiaiden poikiensa kanssa. Kerroin myös muuttoajankohdan ja silloin vallinneen säätilan sekä oletetun tilanteen, jossa he ovat seisomassa muuttokuormansa edessä. 

Kuvaa olisi voinut parantaa vielä paljon, mutta jo tällaisenaan se on riittävän hyvä ja nopeasti katsottuna voisi sekoittua aitoihin valokuviin, vaikka kuvassa on monia virheitä.

Tekoälyllä tuotettu kuva perheestä vuonna 1866.
Tekoälyllä tuotettu kuva perheestä vuonna 1866.

Kuvia käytettäessä onkin tärkeä merkitä tekoälyllä tuotetut kuvat selkeästi ja tässä yhtenä mallina voi pitää Helsingin Sanomien ohjeistusta. Lehdessä ei julkaista valokuvalta näyttäviä tekoälyn tekemiä kuvia kuin poikkeuksellisista syistä. Tällöin kuvaan kiinni on merkittävä, että kyse on tekoälyn tuottamasta kuvasta. Jos tieto on vain esimerkiksi kuvan yhteydessä tekstissä, on kuva siitä irrotettuna helppo sotkea aitoihin valokuviin. Ei siis sotketa tekoälyllä tuotettuja kuvia aitoihin kuva-aineistoihin. 

Pitäisin tekoälyllä tuotettuja kuvia parempana vaihtoehtona aitoja valokuvia, taideteoksia tai grafiikkaa, jotka kertovat halutusta ajasta tai asiasta. Esimerkiksi 1860-luvun osalta harkitsisin oheista Hilda Olssonin vuonna 1868 tekemää kuvaa Viipurin alueen nuorisosta juhla-asuissa. Finna-palvelusta löytyy jo valtava määrä eri menetelmin valmistettuja kuvia, taideteoksia ja grafiikkaa museoiden ja arkistojen laajoista kokoelmista. 

Hilda Olson, nuorisoa 1868. Kuva Museovirasto.
Hilda Olson, nuorisoa 1868. Kuva Museovirasto.

Tekoälyä hyödyntävästä kuvantunnistuksesta voi olla myös suurta hyötyä sukututkimuksessa, mutta tässäkin riittävän kriittinen suhtautuminen saatuihin tuloksiin on eduksi ja myös eettiset kysymykset on syytä pitää mielessä. Tekoälyohjelmat ovat jo todella hyviä, joten ainakin niitä voi testata ja katsoa mitä saa tulokseksi.  

Yksi esimerkki kuvantunnistuskokeilusta on Viron kansallisarkiston muutama vuosi toteuttama laaja valokuvien digitointihanke, jossa he hyödynsivät myös henkilöiden tunnistamiseen räätälöityä ohjelmistoa. Ohjelmisto tunnisti sadoista tuhansista kuvista mahdollisesti samaa henkilöä esittävät kuvat henkilöiden yksilöllisten piirteiden avulla. 

Todennäköisesti kaikki samaksi tunnistetut eivät kuitenkaan olleet samoja henkilöitä, mutta tunnistuksen toimivuudesta kertoi myös sen löytämät kuvissa useimmiten esiintyvät henkilöt. Yksi niissä eniten esiintyneistä henkilöistä oli Josef Stalin. Syy tähän oli monessa 1940- ja 1950-luvun vaihteen kuvassa näkyvä, huoneen seinällä tai pöydällä oleva Stalinin kuva. Tekoälyllä tuotetut kuvat ja kuvantunnistus ovat jo arkipäivää, mutta käytetään niitä vastuullisesti myös sukututkimuksessa. 


Ismo Malinen


Kirjoitus on julkaistu aiemmin Jäsenviesti Jalmarin kesäkuun numerossa 2025.