Haluatteko keskustella kirjemetadatasta?
1800-luvun kirjekokoelmien kuvailu- ja luettelointitietoja kokoava ja tutkiva CoCo-projekti on ensimmäisen puolen vuoden aikana kolkuttanut useiden kulttuuriperintöorganisaatioiden oville, ja ne ovat iloksemme avautuneet ammolleen. Olemme jo vastaanottanut ensimmäiset datasiirrot. Kansalliskirjastolta saimme MS Word -muotoiset kirjekokoelmaluettelot ja Kansallisgallerian ensimmäisenä datasiirtona CSV-muotoista kuvailutietoa Suomen Taideyhdistyksen hallituksen pöytäkirjoihin liitetyistä kirjeistä.
Kansallisarkiston ja Suomalaisen Kirjallisuuden Seuran kanssa pohdimme parhaillaan, miten ja mistä arkistotietojärjestelmästä on helpoin ottaa ulos heidän hallussaan olevien satojen ja taas satojen kirjekokoelmien tiedot ns. datadumppeina. Odotamme innolla, että pääsemme kurkistamaan Svenska Litteratursällskapetin melkein 250 000 kirjeen tietokantaan. Snellman-instituutilta saamme tutkittavaksemme J. V. Snellmanin kirjeiden metatiedot ja tartumme tuota pikaa avoimen rajapinnan kautta haravoitaviin aineistoihin, kuten Elias Lönnrotin kirjoittamaan ja vastaanottamaan yli 6000 kirjeeseen (Suomalaisen Kirjallisuuden Seura).
Ensimmäiset datasiirrot avasivat heti uusia näkymiä 1800-luvun kirjeenvaihtokulttuuriin. Hankkeen tutkija Petri Leskinen hyödynsi jo olemassa olevaa Kirjesampo-portaalia Kansallisgallerian aineistoon. Näin syntyneet visualisoinnit havainnollistavat esimerkiksi Taideyhdistyksen ylirajaisia verkostoja ja kertovat yhdistyksen keskeisten toimijoiden kirjeaktiivisuudesta.
Meille on ollut iloinen yllätys se, minkälaisella innostuksella kulttuuriperintöorganisaatiot ovat lähteneet hankkeeseen mukaan. Toivomme, että voimme vastapalveluksena tarjota kumppaneiksemme ryhtyneille organisaatioille (ja heidän asiakkailleen) uuden tavan löytää suuriruhtinaskunnan kirjeaineistoja ja analysoida kirjeenvaihtokulttuureja niin määrällisesti kuin laadullisestikin. Ehkä voimme kertoa jotain uutta myös kunkin muistiorganisaation ”dataprofiilista”?
Huomasimme kuitenkin jo ensimmäisten datatapaamisten aikana, kuinka vaikeaa on kerätä suhteellisen määrämittaista tietoa eri tavoin hallituista kokoelmista. Kirjekokoelmien metatiedoissa on useiden vuosikymmenien kerrostumia ja tiedot on säilytetty vaihtelevin, osin päällekkäisin muodoin manuaalisista kortistoista Word-dokumentteihin ja tietokantoihin. Lähde- tai datakritiikin kannalta on keskeistä koota luotettavaa tietoa myös siitä, kuinka suuren osan kokoelmissa olevasta aineistosta voimme ylipäätään tavoittaa: kuinka suuri osa 1800-luvun kirjeenvaihdosta on luetteloitu jollakin kuvailun tasolla?
Hankkeen tutkija ja data-asiantuntija Johanna Enqvist on kuvailutietojen “arkeologisen” analyysin helpottamiseksi kehittänyt uuden työkalun eli Webropol-muotoisen kirjemetadatakyselyn. Arkistotutkija Ilkka Välimäki SKS:sta toimi helmikuisena keskiviikkona testikäyttäjänä ja tarkkailimme Johannan kanssa koetilannetta. Kysely läpäisi Ilkan syynin ”vähäisin muutoksin”, joten voimme ensi viikolla levittää hankkeen kirjemetadataverkot entistä laajemmalle. CoCo-projektia jännittää!