Gå till huvudinnehållet

Datahantering

Att publicera data och metadata

Öppen forskningsdata ökar synligheten och genomslaget för forskning, skapar nya forskningsmöjligheter och underlättar tvärvetenskapligt samarbete. Öppna data gör det också lättare att kontrollera kvaliteten på forskningsdata, vilket ökar forskningens transparens och tillförlitlighet. Genom öppenhet demokratiseras och stärks forskningen. 

Att publicera forskningsdata kan skapa flera möjligheter för forskare till meritering t.ex. via citeringar eller registrerade nedladdningar. Det blir på så sätt möjligt att få erkännande för flera delar av forskningsprocessen än enbart den publicerade artikeln. 

Forskningsdata och publicerade forskningsresultat producerade på Arcada borde publiceras öppet och göras allmänt tillgängliga. Det ska vara möjligt att hitta och referera till data. Vid återanvändning av data gäller normal referenspraxis. 

Tänk på följande frågor när du publicerar data: 

1. Hur beskriver och publicerar du metadata av dina data?

Metadata är data om data och beskriver sammanhang, innehåll, struktur, sammanställning och hantering av forskningsdata (Se följande avsnitt om Metadata och datadokumentation på den här sidan). Informativ metadata är nyckeln till att göra data öppen, begriplig och återanvändbar. 

2. Vilken del av data öppnas och publiceras?

  • Även om du inte kan dela din forskningsdata, kan du ändå publicera metadata för din forskningsdata. Observera att metadata för data som innehåller personlig information kan öppnas, även om själva data inte kan vara öppna.

  • Data som innehåller personlig information kan endast publiceras anonymiserade. Pseudonymiserade data är fortfarande personuppgifter och därför kan de inte öppnas utan explicit samtycke för ändamålet. Se Anonymisation and Personal Data av Finlands samhällsvetenskapliga dataarkiv (FSD). 

  • Forskningsdeltagares samtycke krävs för öppnandet av materialet, ur vilket forskningsdeltagarna är direkt identifierbara. Om du planerar att dela data som innehåller personlig information, kontakta Arcadas dataskyddsombud dataskydd@arcada.fi

3. Var publiceras data?

Be om förvaringsutrymme i IDA-tjänsten från datamanagement@arcada.fi.

Alternativt kan du välja ett annat lämpligt arkiv för att publicera och öppna dina data redan i början av projektet.

4. När blir data tillgängliga? Finns det behov av att ange en embargoperiod? 

5. Vilken licens använder du för att öppna och dela dina data? Licensiering är nödvändig för publicering av data. Det rekommenderas att använda  Creative Commons (CC)-licenser för öppen forskningsdata. 

6. Kommer en del av data att förstöras? För mera information se Data disposal av Finlands samhällsvetenskapliga dataarkiv (FSD) och Five steps to decide what data to keep av Digital Curation Centre (DCC). 

Metadata och datadokumentation

Datadokumentation betyder att beskriva data, är data om data och ger information om vem, vad, när, var, varför, hur av dina data. Att investera tid i att dokumentera data gör det enkelt att förstå data för både andra och dig själv och minskar risken för falsk förklaring av data. Datadokumentation kan vara en readme-fil (läsbar för människor) och metadata (läsbara för datorer): 

  • Readme-filer är textdokument (t.ex. i formatet .txt) som ger information om datafiler för att säkerställa att de tolkas korrekt. En readme-fil förklarar vilka data ett forskningsprojekt har, hur data skapades, var data kommer från, hur man kan tolka dem, vad förkortningarna betyder, vilken programvara som behövs för att använda data, hur data har modifierats, och kan innehålla information om titeln, skaparen, finansieraren, relevanta datum för datainsamling och publicering, lokalisering, metodik, ämne, filformat, filnamnsystem och mappstruktur, dataversion, licens och arkivet. 

Skriv en readme-fil om dina data och datafiler. Spara readme-filen på den mest uppenbara platsen i datafilmapparna för att säkerställa att den märks omedelbart. 

  • Metadata är tekniska data som beskriver ett forskningsdataset. När data görs FAIR spelar metadata nyckelrollen. Systematiskt beskrivna forskningsdata är nyckeln till att göra dina data begripliga, sökbara och återanvändbara. 

Metadata bör vara maskinläsbara. Det finns standardmetoder tillgängliga för datadokumentation som kallas metadatastandarder, som bör användas om de är lämpliga för datan. Fairdata Qvain-metadataverktyget gör beskrivning och publicering av forskningsdata smidig och enkel för forskare utan att kräva tekniska färdigheter. 

Data som beskrivs och publiceras av Qvain-metadataverktyget överförs automatiskt till det finska metadatalagret Metax, som är integrerat med både Etsin (forskningsdatasökare) och Finlands nationella forskningsinformationscentrum/Finnish National Information Hub/Tutkimustietovaranto (en tjänst som också beställts av Undervisnings- och kulturministeriet och CSC). 

Se Qvain User Guide

Andra viktiga frågor inkluderar dataformat, konventioner om filnamn, versionskontroll och mappstruktur. Se Dataformat och organisering

Mer information, se: 

Långtidsbevaring av data

Långtidsbevaring innebär att data bevaras i mer än 25 år. När du skapar dina data behöver du överväga hur länge din data ska bevaras. Ta reda på om det finns disciplinspecifika krav för att bevara data, eller om forskningsfinansiärer och förlag har särskilda krav. 

Undervisnings- och kulturministeriet i Finland har inrättat Fairdata-PAS-tjänsten (Digital Preservation Service for Research Data) för finländska forskningsorganisationer för låntidsbevaring av de nationellt viktigaste forskningsdata. 

Se Digital Preservation (Fairdata-PAS): Guidelines for UH Evaluators av Helsingfors universitet. 

Om du är intresserad av Fairdata-PAS, kontakta datamanagement@arcada.fi

Principer för FAIR data

FAIR-dataprinciperna, formulerade Force11, beskriver centrala riktlinjer för god datahantering och öppen tillgång till forskningsdata. FAIR är en akronym som kommer från orden Findable, Accessible, Interoperable och Reusable. Forskningsdata som publiceras enligt FAIR-principerna innebär alltså att data ska vara möliga att hitta, komma åt, flytta eller kombinera och återanvända.  

Se FAIR forskningsdata (Vetenskapliga rådet) för mera information.

Följ följande steg för att säkerställa att dina (meta)data är FAIR: 

  • Spara dina data i ett öppet filformat som Rich Text Format (.rtf) eller .csv.

  • Arkivera dina data i ett etablerat digitalt arkiv i slutet av projektet. Kom ihåg att välja ett arkiv som ger en persistent identifierare (PID), t.ex. DOI eller URN. 

  • Skapa beskrivande metadata för data. De flesta av FAIR-dataprinciperna gäller metadata. Se Metadata och datadokumentation

  • Licensiera dina data med en licens som tydligt anger villkoren och begränsningarna för återanvändning. 

Läs mera:

Det rekommenderas att använda Fairdata services som erbjuds av Undervisnings- och kulturministeriet och produceras av CSC - IT Center for Science Ltd för datahantering, datalagring, datadokumentation, spridning och distribution av dataset samt digital lagring av forskningsdata. Tjänsterna inkluderar: 

Tillgänglighetsutlåtande