Blogs

Kirjemetadatavuosi 2022 pähkinänkuoressa

Tammikuussa on hyvä aika katsoa paitsi kohti tulevaa kesää, myös taaksepäin. CoCo-konsortiolla oli tavattoman kiireinen mutta samalla hauska ja monella tavalla opettavainen vuosi! 

Vuoden 2022 kuluessa keräsimme kattavasti tietoa suomalaisten muistiorganisaatioiden 1800-luvun kirjekokoelmien laajuudesta ja sähköisistä muodoista Webropol-kyselyllä sekä otimme vastaan useita laajoja metadatakokonaisuuksia. Lämmin kiitos sekä kaikille kyselyyn jo vastanneille että aineistoa hankkeen käyttöön luovuttaneille!

Kyselylinkit toimivat edelleen, joten tänäkin vuonna ehtii mukaan. Olemme iloisia myös siitä tiedosta, että kokoelmissa ei ole 1800-luvun kirjeitä tai niitä ei ole ehditty luetteloimaan. Tämä auttaa meitä muodostamaan kokonaiskuvaa kulttuuriperintöorganisaatioiden kirjeaineistoista.

CoCo-hankkeessa koottu data sisältää tällä hetkellä noin 600 000 kirjeen tiedot. 1800-luvun kirjekokoelmien metadataa ovat meille kuluvana vuonna luovuttaneet muun muassa Kansallisarkisto, Kansalliskirjasto, Kansallisgalleria, Åbo Akademi’s bibliotek, Svenska Litteratursällskapet i Finland, Suomalaisen Kirjallisuuden Seura, Päivälehden arkisto, Postimuseo ja Siirtolaisuusinstituutti.

Jatkuva yhteistyö kulttuuriperintöorganisaatioiden kanssa on CoCo-hankkeen ytimessä. Olemme tavanneet arkistojen, museoiden ja kirjastojen väkeä myös dataluovutuksien jälkeen, kertoneet kirjemetadatan käsittelystä ja esitelleet muun muassa alustavia visualisointeja. Alla olevassa kuvassa on Kansallisgallerian datasetti (aktiivisimmat kirjoittajat ja huippuvuodet) ns. semanttisen portaalimme kautta tarkasteltuna.

Dataa olemme saaneet eri tavoin rakenteistetuissa muodoissa, mutta myös yksinkertaisesti word-muotoisina arkistoluetteloina. Joissain kulttuuriperintöorganisaatioissa yhteistyö on innostanut pidemmälle menevään “datatyöhön”: blogistamme voit lukea, kuinka esimerkiksi Kansallisgalleria valmisteli kirjemetadataansa ennen luovutusta.

Datan käsittelyyn erikoistuneet tutkijamme puurtavat parhaillaan näiden aineistojen harmonisoinnin eli esimerkiksi yhdenmukaistamisen sekä rikastamisen eli linkittämisen parissa. 1800-lukua tutkivat humanistit puolestaan pohtivat muun muassa naistaiteilijaverkostoja ja kirjemetadatan avaamia uusia näkymiä arkisto- ja kokoelmahistoriaan.

Vuoden aikana esittelimme hanketta sekä alustavien analyysien ja kokeilujen tuloksia useissa tieteellisissä konferensseissa sekä kaikille kiinnostuneille suunnatuissa tilaisuuksissa. Julkaisimme tai panimme alulle myös tieteellisiä artikkeleita (ks. julkaisuluettelo hankkeen sivustolla). Veimme myös CoCo:n datasetin siemenen (Kansallisarkisto, Kansallisgalleria, Elias Lönnrotin kirjeet, J. V. Snellmanin kirjeitä) kansainvälisen opiskelijajoukon ruodittavaksi Helsinki Digital Humanities Hackathoniin, missä aineistoa tutkailtiin mm. verkostoanalyysin välinein. Alla olevan kuvan avulla voi tarkastella Kansallisarkiston datasetin (yli 290 000 metatietotietuetta) rakennetta Gephi-verkostoanalyysivälineen visualisoimana.

Lisäksi tutkijamme ehtivät tänä vuonna Amsterdamiin (Huygens ING) ja Berliiniin (Berlin-Brandenburg Academy of Sciences and Humanities, BBAW) sikäläisten kirjemetadataa tutkivien hankkeiden vieraiksi vaihtamaan kokemuksia ja jakamaan tietoa. Tutkimusvierailujen matkakertomukset löytyvät niin ikään CoCo:n blogista, oheisista linkeistä.

Hanke jatkaa vuonna 2023 aineistojen vastaanottamisen, työstämisen ja tutkimisen parissa Aalto yliopistossa, Helsingin yliopistossa ja Suomalaisen Kirjallisuuden Seurassa. Metadatan kokoamista koordinoinut Johanna Enqvist on siirtynyt uuden vuoden myötä uusiin tehtäviin, mutta työtä jatkaa Kansallisgalleriasta CoCo-hankkeeseen ja SKS:n tiimiin siirtyvä Hanna-Leena Paloposki. Hanna-Leena vastaa mielellään yhteistyöhön tai metadatan luovuttamiseen liittyviin kysymyksiin (hanna-leena.paloposki@finlit.fi)!