logo

Ett digitalare kulturarv

Digisams verksamhet 2011-2015

12 Forskningssamverkan

Digisams bedömning

En utvecklad samverkan mellan akademin och kulturarvsinstitutionerna har stor potential att stärka i synnerhet, men inte uteslutande, den humanistiska och samhällsvetenskapliga forskningen. Myndigheter och institutioner bör därför utveckla och anpassa sina digitala erbjudanden i enlighet med forskningens behov. Bland annat bör de i ökad utsträckning, i dialog med aktiva forskare och i linje med PSI-lagen, erbjuda obearbetade och öppna rådata för fri nedladdning, digital bearbetning och analys.

De samarbeten mellan kulturarvsinstitutioner och akademi som initierats av Digisam, behöver förvaltas, utökas och fördjupas. Bland annat bör förutsättningarna undersökas för att ansluta Sverige till den europeiska forskningsinfrastrukturen DARIAH-ERIC (Digital Research Infrastructure for the Arts and Humanities - European Research Infrastructure Consortium), som syftar till att stärka och stödja digitalt stödd forskning och undervisning inom humaniora och konstområdet.

Forskarna anges ofta som en viktig användargrupp för digital kulturarvsinformation. Trots detta finns än så länge få exempel på särskild anpassning till forskarnas behov, som t.ex. nedladdningsplatser för öppna forskningsdata eller tjänster som stödjer analyser av stora datamängder, s.k. data mining. De akademiska forskarna vet för lite om vad kulturarvsområdet kan erbjuda och myndigheter och institutioner har svårt att hålla jämna steg med utvecklingen inom akademin i allmänhet, och området digital humaniora i synnerhet. Området behöver utvecklas och en fördjupad dialog mellan akademi och kulturarvsområde behöver komma till stånd, gärna med utgångspunkt i redan etablerade strukturer på lärosätena, som t.ex. HumLab och centrumbildningar.

Sveriges kulturarvsinstitutioner förvaltar stora mängder material som genom årens lopp har samlats in, bl.a. som källmaterial för forskning. Detta är historiska resurser med bredd och djup. Som tvärsektoriell samhällsinformation har dessa ett vidare intresse för många områden utanför de rent kulturhistoriska. Här finns uppgifter som skulle kunna ligga till grund för ny förståelse i arbetet med aktuella samhällsutmaningar inom t.ex. miljö, klimat, folkhälsa och familjemönster. Men det är få institutioner som idag kan bedriva egen forskning och avståndet till akademins aktiva forskare har ofta varit svårt att överbrygga.

Idag har forskarna tillgång till nya verktyg och metoder som gör det möjligt att bearbeta digitala forskningsdata på nya sätt. Det innebär att resurser som länge legat slumrande i arkiv kan få nytt liv och göra nytta inom många forskningsdiscipliner. Internationellt finns flera intressanta exempel på detta. I projektet Old Weather har t.ex. äldre loggböcker använts som underlag för förståelsen av klimatförändringarna och genom att använda naturhistoriska samlingar inom ramen för Global Biodiversity Information Facility (GBIF) har äldre samlingsdata kunnat ligga till grund för forskning om minskande populationer av humla.

På universitet och högskolor finns ett växande intresse för de mångfacetterade källmaterialen hos arkiv, bibliotek och museer, som kan ligga till grund för forskning i många olika discipliner. Utöver att på ett självklart sätt göra nytta inom sina mest närliggande forskningsfält – som när t.ex. ett konstmuseum tillgängliggör äldre grafik för konstvetenskaplig forskning – kan samma material även vara till glädje på andra områden. Digitalt kulturarv kan bl.a. tillhandahålla språkvetenskapligt intressanta textmängder från snart sagt vilka ämnesområden som helst, eller erbjuda vetenskapshistoriska källor för studier i sådant som t.ex. ett akademiskt ämnes utveckling.

Humanistiska forskare måste traditionellt sett ofta lägga dyrbar forskningstid på att leta efter och sammanställa sina källmaterial. Med digitalt lättillgängliga resurser blir den fasen kortare och mer tid kan läggas på fördjupade studier och analys. Kulturarvsinstitutionerna bör därför eftersträva mer konkret utveckling och anpassning av sina digitala erbjudanden i enlighet med forskningens behov. Bland annat bör de i ökad utsträckning, i dialog med forskningen och i linje med PSI-lagen kunna erbjuda obearbetade och öppna rådata för fri nedladdning, digital bearbetning och analys.

Mot bakgrund av ovanstående finns det många skäl att söka ett närmande mellan kulturarvsinstitutionerna och forskningen. Digisam har under sin verksamhetsperiod på olika sätt sökt långsiktig och fördjupad samverkan med universitetsvärlden. Digisam har också gästföreläst i olika sammanhang och deltagit i arbetsmöten vid KTH, universiteten i Göteborg, Lund, Umeå och Uppsala samt vid högskolan i Borås. Se vidare förslag om mer tekniskt baserad samverkan med SUNET i kapitel 17. En skalbar och flexibel infrastruktur för kulturarvsinformation.

Digisam har valt att i första hand utveckla samverkan med forskningen tillsammans med starka och högprofilerade aktörer som uttryckt en explicit vilja till fördjupat samarbete med kulturarvsområdet.

12.1 Kungl. Tekniska högskolan

Den 10 oktober 2012 skrev RA/Digisam tillsammans med RAÄ, KB och Centralmuseernas samarbetsråd under en avsiktsförklaring med Kungliga Tekniska högskolans (KTH) skola för teknikvetenskaplig kommunikation och lärande (ECE), med titeln Nya innovativa former för användning av digitaliserat material i undervisningen. Syftet var att, i samverkan med skola och ABM-institutioner, utveckla teknik och metoder för att i undervisning på alla nivåer dra nytta av den växande mängden digitalt tillgänglig kulturarvsinformation. Centrala värden i samverkan var öppna och länkade kulturarvsdata, semantisk webbEtt begrepp myntat av World Wide Web Consortiums (W3Cs) chef Tim Berners-Lee, som också är skapare av världswebben (WWW). Begreppet beskriver metoder och teknik för att möjliggöra för maskiner att förstå innebörden eller "semantiken" i informationen på webben. och stabil infrastruktur. Digisams styrgrupp utsåg sekretariatet att representera undertecknarna i samverkan med KTH.

Avsiktsförklaringen ledde vidare till ett mer operativt samarbete med KTH i bl.a. DISKA-projektet som, med stöd från Vinnova, tagit några första steg mot länkade öppna data som är en förutsättning för den semantiska webben. Avsikten med projektet var att komma vidare i frågan om auktoriteterKälla som enligt överenskommelse utgör standard för stavning, termer eller policy vid registrering. och att driva på utvecklingen för mer öppna datakällor inom kulturarvsområdet genom att göra ett urval auktoritetslistor från medverkande myndigheter stabilt tillgängliga som länkbar öppen data (LOD). Det mer långsiktiga syftet med detta var i sin tur att skapa förutsättningar för dessa data att komma till bredare nytta, även i andra samhällssektorer. Projektet löpte under 2013 och inleddes med en bred inventering av potentiellt intressanta material hos Digisams medverkande myndigheter och institutioner. Ett urval av resurserna omvandlades sedan till öppna data med beständiga identifierareMed beständiga identifierare/PID:ar (persistent identifiers) avses här unika kodsträngar kopplade till varje objekt/post. Sådana PID:ar är en förutsättning för att man sedan med fasta länkar/URI:er (uniform resource identifiers) ska kunna skapa referenser mellan olika objekt/poster i ett nätverk som t.ex. Internet. och finns idag tillgängliga på KTH.

Samarbetet med KTH har under Digisams verksamhetsperiod löpt vidare och fördjupats. Från KTH:s sida har planerna på att bygga upp ett mer långsiktigt Kulturarvsprogram utkristalliserats. Huvudfokus i genomförda, så väl som planerade, samarbetsprojekt ligger på arbetet med auktoriteter, det vill säga standardiserade och tekniskt sammankopplade referensdata om t.ex. historiska personer eller ortsnamn. Sådana strukturer kan förväntas vara till glädje för många intressenter både inom och utom kulturarvssektorn och samtidigt kunna bidra i KTH:s uppbyggnad av ett forskningsprogram där kulturarv och teknik mer långsiktigt vävs samman. Frågan om auktoriteter är fortfarande av forskningsintresse för KTH som planerar för nya ansökningar.

12.2 SWE-CLARIN

Digisam deltar i det konsortium som under ledning av Språkbanken vid Göteborgs universitet och med stöd av VR ska bygga upp SWE-CLARIN (Common Language Resources and Technology Infrastructure).

SWE-CLARIN är en språkteknologisk infrastruktur till stöd för framför allt humanistisk och samhällsvetenskaplig forskning som också väntas kunna fungera som drivhus för en bredare implementering av digitala verktyg i arbetet med historiska texter och talresurser. Det handlar om datalager, digitala verktyg och expertstöd för metoder för maskinell bearbetning av språk- och taldata. En inventering av relevanta material är påbörjad och flera seminarier och workshops planeras inom satsningens ram.

Exempel på akademiska arbeten som uteslutande är baserade på digitala arkivstudier finns redan. Storskalig informationsutvinning från historiska texter, data mining, är ett växande fält som gör det möjligt att frilägga intressanta mönster och utvecklingslinjer genom att processa mycket stora textmängder. Själva den digitala snabbheten och precisionen i sig möjliggör också undersökningar av en typ som man inte ens kunde föreställa sig för ett par decennier sedan. Ett exempel på användning av nya verktyg på humanistiska fält kan iakttas i det historiska forskningsprojektet Gender & Work vid Uppsala universitet. Erfarenheten där visar att språkteknologisk metod kan förkorta vissa forskningsmoment med kanske 90 procent, utan att resultaten för den skull tappar i kvalitet.

13 Juridik