DIGITAALISEN SUKUTUTKIMUKSEN OPAS

Hakutietokannat

Sukututkija voi hyödyntää työssään useita hakutietokantoja. Ne helpottavat ja nopeuttavat tiedonhakua, mutta on syytä pitää jatkuvasti mielessä, että ne ovat kaikki toisen - tai joskus jopa useamman - käden lähteitä. Luonteestaan johtuen ne sisältävät monenlaisia virheitä; jo alkuperäisdokumentin lapsuksia ja puutteita sekä nykypäivän tallentajien luku- ja huolimattomuusvirheitä. Tietokannat eivät siis korvaa alkuperäistä asiakirja-aineistoa, vaikka tekevätkin sen helpommin lähestyttäväksi.


HisKi: historiakirjojen hakuohjelma

Suomen Sukututkimusseuran ylläpitämä HisKi on seurakuntien historiakirjojen eli kastettujen, vihittyjen ja haudattujen luetteloiden hakutietokanta, joka sisältää jonkin verran myös muuttaneiden luetteloiden tietoja. Alun alkaen henkilötietueet kopioitiin seuran 1920-1940-luvuilla teettämistä seurakuntien historiakirjojen käsin kirjoitetuista kopiosarjoista (ns. mustat kirjat), mutta sittemmin tietoja on poimittu myös digitoiduista alkuperäisasiakirjoista. Koska HisKin tiedot ovat usein tulosta kolmivaiheisesta kopiointiprosessista, tietokanta sisältää erheitä, jotka palautuvat papiston aikanaan tekemien erheiden ohella eritoten sekä mustien kirjojen kopiointityöhön että tietokannan tallennusvaiheeseen. Niinpä HisKin tietoihin tulee aina suhtautua kriittisesti, ja ne on ehdottomasti tarkastettava alkuperäislähteistä, jotka sisältävät myös tietoja, jotka mustien kirjojen kopioitsijat sulkivat kopiointityönsä ulkopuolelle.


HisKi-tietokannan etusivu


On myös pidettävä mielessä. että tietokanta on toistaiseksi keskeneräinen. Projektin ensimmäisessä vaiheessa työ pyrittiin ulottamaan koko maan osalta vuoteen 1850. Joistakin seurakunnista tietoja on hakuohjelmassa jopa 1900-luvun alkuun, mutta useista seurakunnista tietoja on syötetty varsin hajanaisesti, mikä luonnollisesti vaikuttaa keskeisesti hakutulosten tulkintaan.

Parhaimmillaan HisKi on sukututkijan tutkimusavustaja, jonka avulla voidaan tehdä nopea peruskartoitus tutkitun perheen kokoonpanosta, vilkaista missä päin maata tiettyä suku- tai talonnimeä esiintyy, tai haravoida rippikirjoista yllättäen hävinnyttä perhekuntaa vaikkapa naapuriseurakunnista.

Tietokanta on sikäli joustava hakuväline, että hakuun voidaan yksittäisen seurakunnan lisäksi valita myös naapuriseurakunnat tai Ctrl-näppäintä alas pitäen hiirellä klikaten poimia hakuun yksittäisiä seurakuntia vaikka eri puolilta maata. Kunkin seurakunnan tapauksessa valittu hakulomake mahdollistaa myös laajennetun haun käyttämisen, jolloin haluttua merkkijonoa voidaan hakea mistä tahansa valitun aineistoryhmän sisältä.

Vanhojen kirkonkirjojen tekstiasu (ortografia) on horjuva. Se tarkoittaa, että sekä henkilö- että paikannimet saavat tavallisesti useita eri kirjoitusasuja, mikä on huomioitava tekstiä haettaessa. Etunimet HisKissä on normalisoitu, ja näin ollen esimerkiksi standardimuodot Heikki ja Henrik teoriassa löytävät myös muodot Hend:, Hindrich ja Henricus. Hakuja kannattaa kuitenkin usein tehdä erilaisilla muodoilla, sillä erityisesti suku- ja paikannimien tapauksessa hakuohjelman normalisointi on erittäin puutteellinen. Niinpä esimerkiksi hakumuoto Rönkä jättää tätä kirjoittaessa huomiotta kaikki tapaukset, joissa kirjoitusasuna onkin Röngä. Samoin kirjaimet c ja å on syytä tarkistaa erikseen tai rajata haun ulkopuolelle erikoismerkein, joista kerrotaan tarkemmin jäljempänä. Useimmiten oman sukupiirin nimistön vanhat muodot tulevat tutkijalle rippikirjoista siinä määrin tutuiksi jo varhain, että eri nimimuotojen kokeilu tietokantahaussa on varsin mekaanista. Lisäksi on otettava huomioon sekin seikka, että vanhojen - mutta sinänsä autenttisten - nimimuotojen ohella tietokanta sisältää myös selvästi väärin luettua nimistöä.

Hakutulosten optimoinnin vuoksi on hyödyllistä käyttää seuraavia erikoismerkkejä: asteriski (*) katkaisee hakusanan ja korvaa mitkä tahansa merkkijonot. Niinpä haku Hänni* löytää yhtä hyvin Hänniset kuin Hännikäisetkin. Kysymysmerkki (?) korvaa minkä tahansa yksittäisen merkin haussa. Niinpä H?nn* löytää kirjoitusasut Henni-, Hanni- ja Hynni-. Yhden kirjaimen korvaaminen voi olla sikäli kätevää, että asteriski korvaa myös kokonaisen merkkijonoja tuottaen suuremman joukon hakutuloksia: niinpä haku H*nni* tuottaa tulokseksi edellisten ohella mm. nimet Hämeenniemi, Harjunniemi, Heikinniemi jne.

Hakuohjelma olettaa automaattisesti jokaisen hakusanan loppuvan asteriskiin. Niinpä mikäli haluaa nimenomaan valita hakuun vaikkapa nimen Hänni ilman, että hakukone kaivaa esille myös Hänniset ja Hännikäiset, on haettava nimimuodon perään pantava piste (.). Pelkkä piste hakukentässä puolestaan ottaa hakuun minkä tahansa merkkijonon, joka hakukenttään on syötetty, mutta sulkee tekstittömän kentän haun ulkopuolelle. Tällainen haku voi olla käytännöllinen esimeriksi seulottaessa sukunimellistä väestöä sukunimettömällä alueella.

Joskus voi olla eduksi tarkentaa hakuehtoja entisestään esimerkiksi tilanteessa, että samassa pitäjässä esiintyy sekä Hynnisiä että Hännisiä, jotka halutaan pitää hakutuloksissa erillään. Tällöin voidaan valita hakulomakkeesta laajennettu haku ja merkitä Vapaateksti (JA) -kenttään vaikkapa H?nni* ja Vapaateksti (EI) -kenttään Hynni*, minkä tuloksena hakukone sivuuttaa kaikki Hynniset antaen tulokseksi kuitenkin nimimuodot Hännin ja Hennin jne. Tämä hakuominaisuus voi olla yksittäistapauksissa hyvinkin näppärä, mutta osoittautuu useimmiten tarpeettoman kankeaksi.

Hakuehtoja ei kannata rajata yhtään enempää kuin tilanteessa on välttämätöntä, sillä mitä niukemmilla hakuehdoilla haku on mahdollista tehdä, sen kattavampi hakutulos saadaan ja haun ulkopuolelle jäävien relevanttien tietueiden määrä minimoidaan. Esimerkiksi etsittäessä tietystä seurakunnasta esim. Henrik Anderssonin ja Maria Mattsdotterin lapsia vanhempien nimillä, voi osa hakutuloksista jäädä löytymättä vain sen takia, että äidistä on alkuperäiseen kastemerkintään viety ainoastaan etunimi ilman patronyymiä, joka tässä on merkitty hakuehdoksi. Ja mikäli alkuperäiskirjaukseen äidille onkin kirjattu kerrassaan väärä patronyymi - tätä näet tapahtuu ajoittain - perhekunta jää varsin helposti tietokantahaun ulottumattomiin kyseisen perhetapahtuman osalta. On siis viisasta toistaa hakuja usealla eri hakuehdolla.


HisKi-tallennusalusta

HisKi-tietokanta on toistaiseksi keskeneräinen. Kuka tahansa voi silti osallistua selaimen kautta tietokannan täydentämiseen käyttämällä HisKi-tallennustyökalua, joka ei vaadi rekisteröitymistä tai erillisen ohjelman asentamista omalle laitteelle. Tallentaminen tapahtuu suoraan alkuperäisasiakirjoista SSHY:n Digiarkiston kuvista, mutta muuten tallentaja voi vapaasti valita tallennettavan seurakunnan ja aineiston. Kun tallentaja aloittaa valitun sivun työstämisen, sivu lukkiutuu automaattisesti muilta tallentajilta ja siitä merkiksi sivun valintakuvakkeen viereen syttyy punainen merkkivalo. Kun tallentaja on saanut valitun sivun päätökseen, hän voi lähettää tiedot eteenpäin Submit-painikkeella, minkä jälkeen sivu lukkiutuu lopullisesti ja sen merkiksi punainen merkkivalo muuttuu keltaiseksi. Mikäli tallentaja lukitsee sivun epähuomiossa ennenaikaisesti, ylläpito voi avata sen uudelleen tallennettavaksi.

Vaikka tallennusalustalla tallennus on mahdollista tehdä pienissä erissä ja yksi sivu tai jopa yksi tietue kerrallaan, tärkeintä on, että tallentaminen suoritetaan ohjeita noudattaen johdonmukaisesti ja huolellisesti. Alkuperäisasiakirjan tiedot kirjataan tallennusalustalle kirjain kirjaimelta virheineen päivineen sivu sivulta ja nimi nimeltä. Tallennuksen yhteydessä ei tehdä tulkintoja, lisäyksiä tai korjauksia eli kaikki lyhenteet ja alkuperäisissä kirkonkirjoissa olevat virheetkin tallennetaan sellaisinaan. Sivuilta ei siis poimita vain itseä kiinnostavat tapahtumat ja oman sukulaiset. Tarkoitus ei siis ole luoda sähköistä sukukirjaa tai oman suvun tietopankkia, vaan täydentää HisKi-tietokantaa kaikkine puutteineen ja rajoitteineen.

Tallennetut tietueet eivät siirry välittömästi haettavaksi, vaan ne auditoidaan eli tarkastetaan ja ajetaan tietokantaan keskitetysti. Kaikkien tallentajien on syytä tutustua huolella HisKin tallennusohjeisiin ennen itse tallennustyön aloittamista. Facebookissa toimii tallentajien oma keskustelu- ja neuvontaryhmä HisKi-tallentajat.


Esimerkki HisKi-tallennusalustan tallennussivuista


Katiha: Karjala-tietokanta

Karjala-tietokanta sisältää luovutetun Karjalan ja Petsamon seurakuntien kirkonkirjoista koottuja henkilötietoja 1600-luvulta alkaen. Kansallisarkiston ylläpitämästä tietokannasta on käytössä kaksi eri versiota: täydellinen tietokanta Kansallisarkiston kaikissa toimipaikoissa asiakaspäätteillä sekä suppeampi verkossa vapaasti käytettävissä oleva Katiha-käyttöliittymä. Täydellinen tietokanta sisältää kaiken tallennetun aineiston, yli 11,3 miljoonaa henkilötietuetta ja sen käyttö vaatii käyttöluvan. Verkon käyttöliittymän kautta on haettavissa tietokannan kaikki sataa vuotta vanhempi aineisto, joskin kuolleiden luetteloiden tiedot ovat haettavissa luovutettujen alueiden seurakuntien lakkauttamiseen vuoteen 1949/1950 saakka.


Karjala-tietokannan Katiha-käyttöliittymän etusivu


Koska Karjala-tietokanta sisältää useista seurakunnista kaiken säilyneen väestörekisteriaineiston, syntymät, vihkimiset, muutot ja kuolemat, se mahdollistaa periaatteessa karjalaisten sukujuurien tutkimuksen ilman monimutkaisiksi usein miellettyjä alkuperäisiä kirkonkirjoja. Sukututkimuksen kannalta tässä piilee kuitenkin jokunen vaarallinen sudenkuoppa. Ensinnäkin tietokanta ei sisällä aivan kaikkea säilynyttä aineistoa kattavuudestaan huolimatta, ja toisekseen se sisältää jonkin verran myös lukuvirheitä. Suurin ongelmakohta lienee kuitenkin tietojen hakeminen, sillä harvemmin yksi yksittäinen haku tuo tietokannasta esille kaikki tietueet haettuun henkilöön liittyen.

Tietokanta on koottu lähdeuskollisesti, eli alkuperäisistä kirkonkirjoista tiedot on tallennettu tietokantaan sellaisenaan ilman muutoksia. Käytännössä tämä tarkoittaa, että nimet, paikannimet ja monet muut tiedot saattavat esiintyä tietokannassa useissa erilaisissa kirjoitusmuodossa ja mahdollisia kirjoitusvirheitä sisältäen. Osa tiedoista on kuitenkin normalisoitu, eli vakioitu yhteen kirjoitusmuotoon. Tästä johtuen hakuja tehtäessä katkaisumerkki asteriskin (*) käyttäminen saattaa helpottaa tietojen löytämistä.

Katihassa on käytössä kaksi hakua: pikahaku ja tarkennettu haku. Pikahaku toimii vapaasanahakuna ja sitä käytettäessä mahdollisia hakusanoja ovat esimerkiksi henkilöiden nimet, ammatit ja asuinpaikkakunnat. Tarkennettu haku puolestaan mahdollistaa hakujen tekemisen ja rajaamisen eri ehtojen avulla. Verkon käyttöliittymän yhteydestä löytyy tarkennetut hakuohjeet sekä tekstinä että ohjevideona.

Katihan käyttäjien on syytä huomioida, että liian yksityiskohtaiset hakuehdot tarkennetussa haussa saattavat pudottaa hakutuloksista pois etsittyjä tietoja. Esimerkiksi seurakunnissa, joiden alueella sukunimet olivat itäsuomalaiseen tapaan käytössä (vaikkapa Antrea ja Koivisto), sukunimiä ei yleensä viety kirkonkirjoihin ennen 1800-lukua. Niinpä sukunimi hakuehtona ei tietenkään huomio niitä lukusia tapauksia, joissa sukunimeä ei alkuperäisasiakirjassa esiinny. Haettaessa rippikirjojen tietoja, on lisäksi muistettava, ettei vielä 1700-luvun alkupuolen rippikirjoissa välttämättä esiintynyt väestöllä minkäänlaisia ikätietoja. Niinpä summittainenkin ikätieto hakuehtona johtaa vain siihen, ettei haluttua henkilöä tahdo löytyä tietokannasta. Ortodoksiseurakuntien tapauksissa ikätiedot ovat aina 1900-luvun alkuun asti hyvin horjuvia ja näyttävät vaihtelevan vuodesta toiseen muutaman vuoden, joskus useammankin.


FamilySearch

Myöhempien Aikojen Pyhien Jeesuksen Kristuksen Kirkon eli mormonien hakusivusto FamilySearch avattiin vuonna 1999. Sen keskiössä on valtava kansainvälinen hakutietokanta IGI eli kansainvälinen sukututkimushakemisto (International Genealogical Index), joka sisältää henkilötietueita (syntyneet, vihityt, kuolleet) ympäri maailmaa. Sivuston suurin käyttöarvo onkin juuri siinä, että haluttu henkilö on haettavissa myös Suomen rajojen ulkopuolelta. Aiemmin käyttäjien oli mahdollista hakea samanaikaisesti kummastakin IGI:n lähdetyypistä, indeksoiduista historiallisista asiakirjoista ja käyttäjien toimittamista tiedoista, mutta nyttemmin haut on eriytetty toisistaan. FamilySearchin käyttö on maksutonta, mutta vaatii käyttäjätilin luomisen.


FamilySearch-hakusivuston hakulomake historiallisiin aineistoihin


FamilySearchin käyttöliittymä on saatavilla myös suomeksi ja ruotsiksi, mutta palvelun ulkomaisesta alkuperästä kertoo se, että se esimerkiksi mieltää patronyymit usein sukunimiksi, mikä on otettava huomioon hakuja tehdessä, sillä toisinaan lapset kantavat virheellisesti isänsä patronyymia. Kuten muutkin sekundäärilähteet, myös FamilySearch sisältää lukuvirheitä ja puuttuvia tietueita. Myös erilaisia hakuvariantteja on syytä käyttää, sillä nimistön normalisoinnissa on puutteita. Skandinaavisia erikoismerkkejä å, ä, ö hakukone ei tunne, vaan tulkitsee ne usein vastaavasti kirjaimiksi a ja o.

Sukututkimushakemiston lisäksi FamilySearch sisältää runsaasti digitoitua alkuperäismateriaalia eri puolilta maailmaa. Suomen osalta sivustolta on tutkittavissa esimerkiksi Kansallisarkiston ja Helsingin kaupunginarkiston aineistoja, jotka on digitoitu kumppanuusyhteistyössä FamilySearchin kanssa. Yhdysvaltojen eri osavaltioiden henkilöaineistot ja erityisesti Euroopasta Pohjois-Amerikkaan kulkeneiden valtamerialusten matkustajaluettelot ovat erityisen hyödyllisiä esimerkiksi siirtolaiseksi lähteneiden suomalaisten ja heidän jälkeläisten selvittämisestä. Sivustolle kerätään myös käyttäjiltä valmista sukututkimusaineistoa, mutta sivuston sukupuihin tulee suhtautua kuin mihin tahansa verkosta löytyvään tietoon: kysymyksessä on yksittäisten käyttäjien tulkinnat, jotka voivat sisältää virheitä ja puutteita.