Open Research Data – the FAIRest Data is the Future of Science 20 April 2017 Tallinn University of Technology Publishing Research Data in Repositories: New Output New Knowledge and New Occupations DiVA consortia, Sweden urban.ericsson@ub.uu.se Repository manager DiVA, PhD. DiVA-portal: http://diva-portal.org
Outline Introduction to DiVA (Academic Archive Online) 44 members in a consortia managed by Uppsala University library. The Swedish and European guidelines for research data. Datasets in DiVA
About DiVA Started in 2000 A completely new version in 2008 Developed at Uppsala University Library Initial purpose was to publish doctoral theses in full text A completely new version in 2008 Combined system for full texts and bibliographic references (evaluation/bibliometrics) Registering all kind of publications produced by researchers, teachers and students Built mainly on open source software
DiVA DiVA Members DiVA portal: www.diva-portal.org 44 Universities, Research Institutes and Museums Blekinge Institute of Technology Dalarna University Ersta Sköndal University College Swedish National Defence College The Swedish School of Sport and Health Sciences The Swedish Agency for Marine and Water Management Högskolan i Borås Halmstad University Stockholm School of Economics University of Gävle Swedish Museum of Natural History University of Skövde Örebro University Kristianstad University Swedish Polar Research Secretariat University West RISE/Research Institutes of Sweden Jönköping University Red Cross University College Karlstad University Södertörn University The Royal Institute of Art Sophiahemmet University College Royal College of Music Swedish Meteorological and Hydrological Institute University College of Arts, Crafts and Design Royal Institute of Technology Stockholm University Linköping University Umeå University Linnaeus University Stockholm University of the Arts Luleå University of Technology Uppsala University Mälardalen University The Swedish National Road and Transport Research Institute Mid Sweden University The Nordic Africa Institute Nationalmuseum Swedish Environmental Protection Agency Nordic Council of Ministers DiVA DiVA portal: www.diva-portal.org 950 000 references - 280 000 in full text DiVA Members Use the same system All members contribute to system development Joint funding through fees Layout and some functionality can be adapted locally
Local DiVA-portals
DiVA - Collaboration model Head of UUB Library DiVA-members Management (IT- and Repository manager) Repository manager Strategic issues Support (to members) Working groups DiVA- Members Local Helpdesk Uppsala University
Open access self-archiving Web pages SwePub Dissemination How DiVA is used today Open access self-archiving Web pages SwePub Evaluation, bibliometrics dissertations.se essay.se DRIVER/ OpenAIRE Researcher CV Europeana Coming theses BASE De höga nedladdnings/besökssiffrorna beror säkert till stor del på att användningen av DiVA har ökat under senare år. Fått nya funktioner. Även publikationernas spridning till andra system/databaser har ökat. Vänstra sidan: visas exempel på olika funktioner/användning av DiVA. Högra sidan: hur publikationer/referenser i DiVA sprids vidare till andra söktjänster, databaser och webbplatser. Open access/parallellpublicering: DiVA används som plattform för publicering av avhandlingar, studentuppsatser, rapport- och skriftserier, tidskrifter och annat som produceras vid UU. Här parallellpubliceras även artiklar, bokkapitel och annat förlagspublicerat material. Allt som publiceras I DiVA är fritt tillgängligt för alla som har tillgång till internet. Print-on-demand av bl a avhandlingar via en webbshop. Utvärdering, statistik: Samtliga forskningspublikationer ska publiceras i DiVA. Uppgifterna förs dagligen över till GLIS och utgör underlag för bl.a. årsredovisning och medelstilldelning. Underlag för den bibliometriska delen av KoF11 hämtades från DiVA E-arkivering av studentuppsatser: Studentuppsatser/examensarbeten som publiceras I DiVA kan även arkiveras elektroniskt – man slipper spara arkivexemplar på papper. Innan institutionen går över till e-arkivering måste man få klartecken från universitetsarkivarien. Om institutionen vill börja publicera uppsatser i DiVA kontakta DiVA Helpdesk för mer information och behörigheter. Det går även att enbart arkivera I DiVA (dölja filen eller hela posten). Långtidslagring, stabila länkar: Publikationer i DiVA får ett unikt id (urn:nbn) och långsiktigt stablia länkar. Lägger man fulltexterna I DIVA och länkar till dem från institutionens webbplats istället för att lägga dem direkt på webbplatsen är fulltexterna tillgängliga även om t.ex. institutionen organiseras om, byter namn, webbplats etc. Även ökad sökbarhet då metadata sprids till andra söktjänster och databaser. Print-on-demand Scirus Google, Google Scholar etc. Archive Package Delivery Service Long-term storage, persistent links (URN:NBN) 7
Statistics (Millions) Nedladdningsstatistik för DiVA visar att vi har en stor mängd besökare. 770 000 referenser, varav ca 220 000 finns öppet tillgängliga i fulltext 40 miljoner nedladdade fulltexter (enbart under 2014) och 68 miljoner besökta webbsidor (under 2014) Har vi statistik från 2015?? (Year)
Today’s OA policy from the Swedish Research Council Publications All financed projects from 2010- Articles and Conference papers Open Access within 6 to 12 months (hum/sam) From 2015 only OA articles are accepted From 2017 all publications should have a CC-BY-licens Research data – data publishing plan All project applications from 2012- Requirements for a ”data management plan” for research data for those projects where data collecting is a major part of the project. Research data should “within reasonable time” be published OA VR har haft sitt eget OA-krav sedan 2010.
National Guidelines January 2015: Proposal from Swedish Research Council The Research Council proposes: Sweden should aim to publish everything OA by 2025 Detailed guidelines should be decided 2020 Some issues should be investigated more in detail until 2018 ” Scientific publications and artistic works and research data connected to scientific publications resulting from publicly funded research should be openly available” VR föreslår att Sverige ska ha en målbild som innebär att alla vetenskapliga publikationer (och konstnärliga verk) från 2025 ska publiceras omedelbart öppet tillgängligt. Artiklar ska publiceras i in open access-tidskrift. Alla vetenskapliga publikationer ska ha en CC-licens. Vetenskapliga publikationer = sakkunniggranskade artiklar och konferensrapporter samt böcker som är resultat av offentligt finansierad forskning. Med denna målbild förordar VR ett skifte, vad gäller vetenskaplig publicering, från ett prenumerationsbaserat system till ett öppet tillgängligt. Utreda vidare: - Problem med utgifter för hybridpublicering (som innebär dubbla kostnader) och som kan bli väldigt dyrt, möjligen bör ett tak införas VR kan se hybrid-publicering i en övergångsfas, men vi bör ställa frågan hur länge Sverige ska betala för hybrid OA Vetenskapliga böcker, här hänvisar VR till den nationella samordningsfunktionen Kriterium (UU, GU och LU), som gör det möjligt för forskare att publicera böcker med peer-review och OA. Ekonomiskt och tekniskt stöd till tidskrifter för att stödja en omställning till Open Access. Frågan om ett ev huvudmannaskap, ”KB och DiVA-konsortiet är kompetenta aktörer som har nämnts i samrådet” Kostnader och ekonomisk omställning: Olika alternativ bör utredas. I dialogen har föreslagits öronmärkta ”nya” pengar för open accesspublicering, publiceringsfonder, en lag som tvingar lärosätena att täcka forskares kostnader för publicering, särskilda medel för forskningstunga institutioner etc. VR föreslår vidare att det är rimligt att utbildningsdepartementet skjuter till extra pengar till KB och forskningsbiblioteken, för att klara av att administrera publiceringsavgifter (och förhandla med förlagen).
National Guidelines For research data the Research Council propose… Objective = Research data should be published OA as soon as possible Finance pilot studies 2015-2020 Purpose = to support planning and and building the technical infrastructure at the universities Except supporting infrastructure there will be needs for other expertise – unclear who is responsible of this… VR föreslår att Sverige ska ha en målbild som innebär att all forskningsdata som, helt eller delvis, tas fram med offentliga medel görs öppet tillgängliga så snart det är möjligt. Att genomföra detta är komplext och tidskrävande och det kräver därför ytterligare utredning av vissa frågor (känsliga personuppgifter, samarbete med näringsliv/industri etc). Under perioden 2015 till och med 2020 ska pilotutlysningar genomföras där forskningsdata omfattas av krav på öppen tillgänglighet. Ett sätt att komma igång och driva på utvecklingen. Ett första viktigt steg är då att driva på planering och uppbyggnad av den tekniska infrastruktur som krävs. Teknisk infrastruktur för 1) arkivering (lärosätenas ansvar) och 2) tillgängliggörande. Innebär inte nödvändigtvis att varje lärosäte måste utveckla ett eget system, tvärtom kan det vara lämpligt att lärosätena samverkar kring detta. ”Frånvaron av teknisk infrastruktur och kompetens för att arkivera och långsiktigt bevara forskningsdata är en allvarlig brist vid många lärosäten. Å andra sidan öppnar detta för att lärosätena kan ta fram gemensamma tekniska lösningar och processer.” VR noterar att det finns en motsättning att å ena sidan måste teknisk infrastruktur finnas på plats för att ställa krav och å andra sidan saknas incitament för att skapa infrastrukturen. Pilotutlysningar kan vara ett incitament för att komma igång. Efter den första femårsperioden bör den myndighet som har det nationella samordningsansvaret för arbetet med öppen tillgång till forskningsdata göra en större utvärdering och baserat på detta ge regeringen förslag på fortsatt arbete efter 2020. (Förmodligen kommer VR få detta samorningsansvar) Vetenskapsrådet föreslår att Sverige ska ha en målbild som innebär att all forskningsdata som, helt eller delvis, tas fram med offentliga medel (de två inre ringarna i figur 1) görs öppet tillgängliga så snart det är möjligt.
Swedish National Data Service (SND) Mandate is provided by the Swedish Research Council and covers research data in the social sciences, humanities and health sciences. Aiming to build a national infrastructure (consortia) for research data in Sweden Data Access Unit (curating metadata, support, educate) a place where different roles/functions merge.
Research data - What does it mean for university libraries and DiVA? Different opinions/policies between universities (DiVA members) Is research data something that libraries should deal with? Includes several organizational parts of the university (IT, archive, library, law) Researchers need to meet the demands of the funder, asking us about uploading research data to DiVA Some journals demand a link to published research data Report (2014) about the need for storage of research data at Uppsala University
? What to do in this situation of different policy documents, different preparedness locally and not yet ready long term guidelines? How to harmonise the technical system (DiVA) with the different levels of organisational preparedness? Our ambition: Make DiVA a place where researchers can publish data sets Cooperate with those researchers and organisations who need things to happen. One step at a time
The specification You should specify whether it is primary data (measurement) or aggregated / processed data You should be able to link between records in DiVA You should be able to link between data sets in DiVA New roles need to be selectable (“data producer”) in DiVA When publishing data set there should be a link to a full text publication
DataCite Metadata Scheme used as a guide for DiVA
Release 2016-08-24
Data sets in DiVA
Versions and Relations Links within the repository. Connecting digital objects
If choosing a new or previous version the metadata from that version can be used also for this registration. Upload via URL Maximum 16 GB Decide when to publish the file
New roles and relations
Summary New Output - Datasets and relations/links to other versions and other publications. The repository will represent new parts of the researching process New Knowledge – Repositories become a node also for research data. The repository used for text mining? New Occupations – New roles and collaborations are needed to insure quality for data sets. In the case of DiVA we need to build the repository for different realities.
Thank you!