Blogs

Ja mitä teimmekään vuonna 2023…?

Suomalaisten arkistojen, kirjastojen ja museoiden 1800-luvun kirjekokoelmaluetteloihin sisältyviä tietoja keräävän ja julkaisevan CoCo-konsortion verkkosivuilla on sanapilvi, joka kuvaa hienosti hankkeemme painopisteitä vuonna 2023. “Metadata” on ehdoton mutta ehkä hieman yllätyksetön ykkönen. Seuraavalle sijalle pääsee kolmen kovan koon yhdistelmä, eli “kirjeet”, “kulttuuriperintöorganisaatio” ja “korkeakouluharjoittelu”. Vanhan vuoden päätyttyä ja uuden alkaessa on hyvä katsoa, mitä nämä ovat konkreettisesti tarkoittaneet.

Tällä hetkellä datasetissämme on lähes 760 000 kirjeen ja lähes 70 000 henkilön tai ryhmän (suku, perhe, järjestö, yritys) tiedot. Kirje- ja toimijametatietojen osalta Åbo Akademin kirjaston ja Kansallisarkiston kokoelmat on tällä hetkellä suurimmat (esim. Abo Akademin kokoelmassa on 366 000 kirjeen tiedot, 48 % koko aineistosta) ja Siirtolaisuusinstituutin pienin (250 metadatatietuetta). Vaikka digitaalisissa ihmistieteissä korostetaan massadatan avaamia tutkimusmahdollisuuksia, pienet aineistot voivat osoittautua aivan yhtä arvokkaiksi kuin kaikkein suurimmat; esimerkiksi Siirtolaisuusinstituutin datan myötä CoCon aineistoon saatiin mukaan Amerikkaan muuttaneita Kankaita ja Lehtosia (kuva 1), joiden aineistoja ei toistaiseksi ole tavoitettu muiden kokoelmien kautta. Otamme siis ilolla vastaan myös aivan pienten kirjekokoelmien tietoja!

Kuva 1: Siirtolaisuusinstituutin kirjeenkirjoittajia ja -vastaanottajia 1800-luvulta

Datatyössä keskityimme vuonna 2023 datamuunnoksiin eli arkistoilta, kirjastoilta ja museoilta saadun hyvin monimuotoisen aineiston yhdenmukaistamiseen ja muuttamiseen avoimen datan edellyttämään linkittyvään kolmikkomuotoon. Lisäksi Aalto-yliopistossa työskenneltiin henkilöiden disambiguoinnin eli yksiselitteistämisen kanssa, jossa pystyttiin osin hyödyntämään automaattisia menetelmiä. Kyseessä on merkittävä työvaihe, sillä parhaimmillaan (tai pahimmillaan) sama henkilönimi voi esiintyä eri dataseteissa yli 20 eri muodossa! Toivomme että tästä kehitystyöstä voi tulevaisuudessa olla apua kulttuuriperintöorganisaatioiden kuvaillessa aineistojaan.

Vuonna 2023 hankkeessamme työskenteli kaksi korkeakouluharjoittelijaa yhdenmukaistamassa Kansalliskirjaston ja Svenska Litteratursällskapetin Word-muotoisia kirjeluetteloita. Tämän arvokkaan työn tuloksena saamme nämä keskeiset aineistot mukaan datasettiimme vuonna 2024. Aloittelevan antropologin kokemuksista monitieteisessä tutkimusympäristössä voi lukea täältä. Kansainvälisiä opiskelijoita johdattelimme kirjemetadatan kiehtoviin ulottuvuuksiin myös toukokuisessa Helsinki Digital Humanities Hackathonissa, jonka tuloksena syntyi posteri Epistolary Participation. 

Kiinnostavia tutkimussuuntia ovat lisäksi olleet ns. kriittinen kokoelmatutkimus ja perintöyttämisen prosessit, (nais)taiteilijoiden verkostot sekä muiden kulttuuriperintöaineistojen kanssa yhteentoimivan tietomallin kehittäminen. Syksyn kohokohtana oli hankkeen kansainvälisen Advisory Boardin kokous 15.11. ja seuraavana päivänä järjestetty avoin Unlocking the Past in the Digital Age: Research Questions, Methods and Best Practices -seminaari, johon osallistui yli 40 henkilöä. Olemme koonneet myös verkkosivuillemme tiedot CoCo-hankkeen edustajien konferenssiesitelmistä  ja julkaistuista artikkeleista

Syksyllä 2023 olimme 4-vuotisen hankkeemme puolivälissä. Tänä vuonna mietimme siis jo innokkaasti jatkohankkeita ja etsimme niille yhteistyökumppaneita. Lisäksi avaamme 1800-luvun kirjekulttuuri -portaalin testikäyttäjille tammikuun 2024 aikana (kuva 2). Jos haluat mukaan testiyhteisöön, ota yhteyttä hankkeen data-asiantuntijaan ja tutkijaan Hanna-Leena Paloposkeen (@finlit.fi)!

Esittelemme aineistojamme mielellämme myös erilaisissa tutkimus- ja kulttuuriperintöyhteyksissä. Kulttuuriperintöorganisaatioiden on mahdollista tulla mukaan hankkeeseen ja luovuttaa kirjekokoelmiensa metadataa vielä vuoden 2024 aikana (yhteydenotot hanna-leena.paloposki@finlit.fi). 

Kuva 2: Portaalin laskeutumissivu