Presentation laddar. Vänta.

Presentation laddar. Vänta.

Hantering av forskningsdata – Lärosätes syn Renata Arovelius Luleå 2012-04-02.

Liknande presentationer


En presentation över ämnet: "Hantering av forskningsdata – Lärosätes syn Renata Arovelius Luleå 2012-04-02."— Presentationens avskrift:

1 Hantering av forskningsdata – Lärosätes syn Renata Arovelius Luleå

2 * Vad menar vi med forskningsdata? Forskningsprocessen Handlingstyper Offentlighetsprincipen och Arkivlagen * Vad är hantering av data? Handlingarnas livscykel: Datahantering – bevarande – publicering - återanvändning * Hur kvalitetssäkra, bevara och tillgängliggöra forskningsdata? Metadata Forskningens infrastruktur Samarbete Översikt

3 Vad är forskningsdata? /forskningsmaterial, forskningshandlingar • Handlingar tillkomna inom forskningsprojekt och inom kontinuerligt bedriven forskning

4 Offentlighetsprincipen (OP) Myndighetens verksamhet öppen för allmän insyn (arbete i form av forskning har ingen särställning) *Handlingar som uppstår i samband med forskning är underkastade Tryckfrihetsförordningens regler om allmänna handlingars offentlighet *Typen av forskning och dess finansiering saknar betydelse

5 Vad är arkiv? •Myndighetens allmänna handlingar och sådana handlingar som avses i 2 kap. 9 § TF (minnesanteckningar, utkast etc.), om man beslutar att de ska arkiveras Arkiv = ”Kvalitetssäkrad information” (autenticitet, spårbarhet, beständighet, tillgänglighet )

6

7 Forskningsprocessen: Delprocesser och aktiviteter Archiving: Data and metadata, preservation standards, roules for appraisal

8 JANFEBMAR DAT Datasetet får endast användas i icke kommersiellt syfte. Datasetet är samlat i en komprimerad fil, dataset.zip. Filerna har komprimerats med pkzip.exe och kan efter nedladdning packas upp med t ex. WinZip eller pkunzip.exe.dataset.zip Data setTextBild •Bevarat på hårddisk (laptop) ej acceptabelt; mycket osäkert •Publicerat på webben ej arkivmässigt, utan strategi för långtidsbevarande •Översänt till arkivet metoder och metadata (eArkiv) tillgängliggörande meriterande (”citering standard”: beständiga identifierare för rådata (dataset) säkert

9 Vad är e-arkiv? •E-arkiv beskrivs som system för bevarande eller system för långsiktig informationsförsörjning som kan vara ett fristående system eller ett verksamhetssystem med inbyggd e- arkivfunktion •SLU tillämpar den sistnämnda definitionen (E-delegationen och Riksarkivet)

10 Bevarandefrågor och bevarandestrategi: Enligt Riksarkivets föreskrifter 2009:1, kap. 3, 1 § är universitetet skyldigt att upprätta en strategi för bevarande av elektroniska handlingar. De handlingar som finns i digital form vid SLU omfattar i första hand *forskningsdatabaser inkl. den information som hanteras i IT-system för bearbetning av forskningsdata, *administrativa system som LADOK, PUBLIC och AGRESSO samt andra verksamhetssystem, * system för distansutbildning, kurshantering, elektronisk publicering, universitetens webbsidor samt handlingar i andra digitala format som ljud, film eller foto.

11 eArkiv •Lämpliga metadata (deskriptiva och för bevarande) •Indexering av alla metadata för snabb utforskning •Tillgång till data oavsett tid och plats – god infrastruktur •Skydd för sekretess, ”restricted access” •Möjlighet att följa hela kedjan (länkning rådata – forskningsresultat); beständiga länkar •Garanti för och migrering till beständiga format – långsiktighet

12 Applikationer måste styras av Arkivredovisningen Metadata enl RA-FS 2008:4 måste vara påförda i det uppgifts- lämnande systemet, bl. struktur- enhet (process) och arkivbildare Metadata för e-arkivet skapas i verksamhetssystemen Citerat från ”Vismas” presentation

13 Varför beskriva? Metadata Arkiv = ”Kvalitetssäkrad information” (autenticitet, spårbarhet, beständighet, tillgänglighet ) Typer av metadata: 1.Deskriptiva – hjälper till att hitta och identifiera arkiverade objekt 2.Administrativa – hjälper till att hantera och ”spåra” data 3.Strukturella – talar om hur komplexa objekten är och hur olika delar relaterar till varandra Bevarande metadata hjälper till långtidsbevarande och återanvändning av de digitala objekten.

14 HUR BESKRIVA? •Deskriptiva metadata DC MODS MARC 21 DDI EML GEO-Data, mm. •Bevarande metadata METS PREMIS

15 PREMIS ( Preservation Metadata: Implementation Stategies) och METS (Metadata Encoding and Transmission Standard) Standard framtagen för att effektivt hantera, finna och återskapa den digitala informationen. PREMIS bevarandemetadata innehåller: - proveniensinformation, - fångar aktiviteter kring det digitala objektet och -identifierar tekniska egenskaper - ger även autenticitet till objektet PREMIS schema används som ”METS extensions”

16 METS (Metadata Encoding and Transmission Standard) (METS) är en struktur för att koda och packa ihop metadata för ett digitalt objekt. METS är en flexibel standard som använder XML för att koda upp strukturen.

17 PREMIS OCH METS •I. PREMIS under amdSec (administrative metadata): Object in techMD, Event in digiprovMD Rights in rightsMD Agent with Event or Rights Or •II. All in digprovMD or •III. All in techMD

18 ECDS Metadata (1) •1. Obligatoriska (m) och valfria (o) metadata element i portalen: - Title - Topic category code - Geographical extent -Temporal extent - Additional information regarding georaphic, temporal and vertical extent (o) - Contact information regarding distribution (o) - Data format (o) - On-line resource (o) - Data quality information (o) - Metadata information (fixed or created automatically) - Contact information regarding metadata - Revision (date and type) - Dataset version - Dataset citation (o) - Dataset description - Contact information regarding the dataset - Graphic illustration (o) - Descriptive keywords from thesaurus - Use limitation - Access constraints - Other constraints - Language - Topic category code - Geographical extent - Temporal extent

19 Arkivmetadata for forskningsmaterial/försök- (1) •admSec Object: unik identifierare (typ och värde) ”fixity info” – checksumma, algoritm för att ”återhämta” filtyp, storlek, struktur (format och version) referenskod, antal filer, signum objektets innehåll, ämne (variabler, parametrar, relationer) materialets typ och ursprung procedurer för datainsamling hur objektet uppstått och varför arkivbildare (person/organisation eller dyl.) samband med andra objekt, kompletterande info tidsomfattning, geografisk täckning

20 Arkivmetadata for forskningsmaterial/försök- (2) system- och programinfo hårdvaruplattform komprimering, kodningschema, validitet (checksummor) klassificeringsschema, beteckningar, sökbegrepp gallringsregler, gallringsfrist alla ”inhibitors” (access, use, migration) Rights: unik identifierare (typ och värde) informationens ägare, alla roller inblandade, beskrivning av begränsningstypen (t.ex. sekretess, upphovsrätt, licens) Event: unik identifierare för (typ och värde) typ av ”event” (t.ex. migrering, upprättande, överföring)användnings-, konverterings och migreringshistorik leveranshistorik (”avställning”, tilläggsleverenser; vem och vad) Agents:roller i ”events” eller ”rights” (person. org., software; hänvisning till andra standarder)

21 ECDS - admSec -Title -Revision (date and type) -Dataset version - Contact information regarding the dataset -Use limitation -Access constraints -Other constraints -Contact information regarding distribution (o) -Data format (o) -Metadata information (fixed or created automatically) -Contact information regarding metadata

22 Varför bevara forskningsmaterial •Verifiering av forskningsresultat * Allmänhetens insyn och kontroll * Återanvändning och nya projekt

23 Verifiering av forskningsresultat

24 Insyn och allmänhetens kontroll

25 Återanvändning av data

26 ”Open Access” till rådata •” Att hålla på viktig information blir allt mer förlegat. Nu börjar till och med läkemedelsföretag förstå att de skulle kunna få fram nya läkemedel snabbare och billigare genom att samarbeta och dela med sig av sina data till andra forskare – och till varandra!”

27 En samlad strategi för hantering av forskningsdata •Samarbete om metadata /metadata import, export och standarder •Länkning rådata – publikationer •Systemlänkning/infrastruktur •Strategi för bevarande så tidigt som möjligt i forskningsprocessen

28 The importance of scientific e-infrastructure: A vision for 2030 “Researchers and practitioners from any disciplines are able to find access and process the data they need. They can be confident in their ability to use and understand data, and they can evaluate the degree to which that data can be trusted.” And: “Producers of data benefit from opening it to broad access, and prefer to deposit their data with confidence in reliable repositories. A framework of repositories is guided by international standards, to ensure they are trustworthy”. ”The vision of 2030” inte möjlig att genomföra utan gedigen arkivinsats och en adekvat strategi för bevarande. Riding the wave. How Europe can gain from the rising tide of scientific data. Final report of the High Level Expert Group on Scientific Data. A submission to the European Commission., October p.25

29


Ladda ner ppt "Hantering av forskningsdata – Lärosätes syn Renata Arovelius Luleå 2012-04-02."

Liknande presentationer


Google-annonser