Korkeakouluharjoittelijana CoCo:ssa
1800-luvun lopulla lähetetyn kirjeen ohessa on kuivattu kukka. Onko tämä tieto tärkeää? Tietokoneohjelman parseroitavaksi menevässä tekstitiedostossa informaatio jatkuu ensimmäiseltä riviltä seuraavalle. Miten rivinvaihtoa merkitään?
Itse en ennen viime syksyä ollut koskaan suonut ajatusta arkistoihin hautautuneiden kuivattujen kasvien relevanttiudelle sen enempää kuin ohjelmoinnin haasteillekaan. Kuitenkin nämä kysymykset muuttuivat hyvinkin järkeviksi ja aiheellisiksi, kun aloitin kolmen kuukauden korkeakouluharjoittelun tutkimusavustajana Constellations of Correspondence-konsortiohankkeessa. Työskentelin harjoittelujakson ajan Kansalliskirjastolta projektin käyttöön saatujen kirjeluetteloiden parissa. Tehtäväni oli muokata näiden Microsoft Word-muotoisten tiedostojen sisältämää metadataa koneluettavaan muotoon. Käytännössä tämä tarkoitti tiedostojen tarkkaa läpi käyntiä ja editointia. Myös editoinnin periaatteiden määritteleminen oli keskeinen osa työnkuvaani. Siitä päästään alussa esittämieni kysymysten äärelle: kuinka reagoida aineistosta nouseviin erityispiirteisiin, mikä informaatio on projektille keskeistä? Kysymysten, niin laajojen kuin yksittäistapauksia koskevien, ratkaiseminen ei tietenkään ollut vain minun vastuullani, vaan ison osa harjoitteluani muodostivat projektin tutkijoiden kanssa pidetyt palaverit ja tapaamiset, joissa vastauksia etsittiin yhdessä.
Ennen CoCo:ssa mukana olemista en tiennyt paljoakaan digitaalisista ihmistieteistä. Opinnoissani aihe oli jäänyt lähinnä satunnaisiksi maininnoiksi, ja kuvittelin, että digitaalinen humanismi on vasta tekemässä tuloaan tutkimuskentälle. Harjoittelun aikana ymmärsin, ettei asia suinkaan ollut näin. Digitaalisten ihmistieteiden avulla sain paljon uusia näkökulmia tutkimuksen tekemiseen. Oli esimerkiksi kiehtovaa huomata, kuinka metadataa visualisoimalla arkistojen aineistot nousevat esiin tavoilla, joiden tietäminen perinteisesti ulottuisi lähinnä niihin yksittäisiin toimijoihin, jotka työskentelevät tiiviisti aineiston kanssa. Toisaalta projektin tietoteknisten aspektien ymmärtäminen oli paikka paikoin hieman haastavaa, kun ala ei ollut ennestään tuttu. Sain myös huomata, että suuri datamassa oli kaikkea muuta kuin yhdenmukainen. Jo tapoja merkitä kirjeenvaihtoa oli monia erilaisia, ja yhdessä kirjeluettelossa toimiva editointiratkaisu ei toiminutkaan toisessa tiedostossa, jossa olivat käytössä aivan erilaiset merkitsemistavat. Poikkeuksen poikkeukset opettivat tiettyä nöyryyttä suurten aineistomassojen edessä.
Haasteista huolimatta metadatan parissa työskentely oli hauskaa. Kirjeluetteloissa vilahtavat tutut menneisyyden henkilöt, erikoiset nimet, vanhojen luetteloiden laatimiseen käytetyt mielikuvitukselliset fontit ja satunnaiset maininnat kirjeiden sisällöstä (ja kirjeiden mukana lähetetyistä kuivatuista kukista tai vaikkapa hiuskiehkuroista) toivat esiin datan ja arkistojen hellyttävyyden pilkahduksia. Luettelot loivat erityisen tarkasteluikkunan niin menneisyyteen kuin kirjeaineistoon ylipäätään. Tutkimusavustajan tehtävissä pääsi haastamaan itseään ja osaamistaan. Sain myös mahdollisuuden kurkistaa digitaalisen humanismin kentälle kansainvälisemmälläkin tasolla, kun osallistuin projektin mukana kahteen workshop-tilaisuuteen Amsterdamissa ja Berliinissä. Harjoittelun huippuhetkiä olivatkin erilaiset kohtaamiset projektin parissa toimivien henkilöiden kanssa. Harjoittelusta kertyneitä kokemuksia rikkaampana onkin hyvä siirtyä jatkamaan opintoja ja polkua työelämään.
Kirjoittaja: Iida Jauhiainen