Biodiversitetsinformatik vid Naturhistoriska riksmuseet Fredrik Ronquist
Enheten för biodiversitetsinformatik Samla museets arbete inom biodiversitets-informatik och mångfaldsanalys från 2011-01-01 Svenska GBIF-noden LifeWatch Delar av Synthesys II (BioCASE) Gemensamt databassystem för samlingshan-tering på NRM och nationellt (DINA och IRIS) Effektivare metoder för digitalisering Informatik kring DNA-barkodning Fylogenetisk analys Forskning inom dessa områden
Personal Fredrik Ronquist, enhetschef Marie Svensson, administratör (deltid) Torsten Eriksson, chefutvecklare för IRIS och DINA, DNA-barkodning (externfinansierad) Maxim Teslenko: programmerare, fylogenetiska metoder (VR-finansierad) DINA-projektet (sökt) två programmerare och en biolog med placering på NRM Svenska GBIF-noden, Synthesys (?) INTE FishBase
Arbetet med samlingsdatabaser Leds av Torsten Eriksson och FR Styrgrupp bestående av förstärkt FA-CK Teknisk referensgrupp bestående av Lars Höglund, Mickaël Graf, representant från KTH Arbetsgrupp bestående av databasan-svariga på respektive enhet
Bakgrund Artdatabankens utlysning av medel för att ta fram ett nationellt samlingshanterings-system (Kulturrådet) DINA-gruppens arbete Rekommendationen att satsa på KE-Emu; tveksamhet över detta NRM beslut om ett gemensamt samlings-hanteringssystem 8 mars 2009
Beslut Naturhistoriska riksmuseet ska senast 2013 ha infört ett samlat datasystem för registrering, hantering och digital publikation av de naturhistoriska samlingar för vilka museet har ansvar. Arbetet med att definiera och implementera samlingshanteringssystemet, ska ske efter samverkan med övriga naturhistoriska museer i landet. Inom Naturhistoriska riksmuseet har forskningsavdelningen ansvar för att föreslå hur det fortsatta arbetet ska genomföras, begrepp definieras, fältstruktur m m standardiseras samt samverkan säkerställas.
sättningarna för att förenkla registreringsmetoderna. 1. Inom tre år efter att ett samlat system implementerats, ska registreringstakten – om nuvarande ekonomiska ramar bibehålls - överskrida den nivå som nåtts under 2008 exkl. resultat som kan hänföras till Accessprojektet och motsvarande tidsbegränsade externfinansierade förstärkningar. 2. Information från samtliga enheters samlingsdatabaser ska finnas digitalt tillgängliga för externa intressenter via ett gemensamt sökgränssnitt med museet som tydlig avsändare. 3. Beslutsfattare ska ha tillgång till de samlade och jämförbara uppgifter som krävs för att kunna redogöra för omfattning och innehåll, resultat, status och behov samt kunna prioritera insatser med koppling till samlingarna, t ex vårdinsatser och prognostisering av lokalbehov. Möjligheterna för personal att kunna flytta mellan enheter utan att behov av ny träning i samlingssystemet uppstår ska studeras, liksom förut- sättningarna för att förenkla registreringsmetoderna.
4. Det system som implementeras ska så långt som möjligt uppfylla de krav som ställts i samband med förstudien för projekt DINA (se bilaga 1). Erfarenheter ska dras av de idag befintliga applikationer som används för motsvarande syften. En kartläggning av befintliga systems uppbyggnad, funktionalitet, styrkor och svagheter ska genomföras. 5. Under 2009 ska forskningsavdelningen utreda och redovisa hur arbetet med att definiera och implementera ett samlat datasys-tem för registrering, hantering och digital publikation ska genomföras och finansieras. Redovisningen ska föreslå en lös-ning som så långt som möjligt svarar upp mot kraven, samt om det finns en oförenlighet mellan dess redovisa prioritering. Ut-veckling och underhåll av befintliga samlingsdatabaser ska upphöra så snart som möjligt, dock senast när ett samlat system har införts 2013. I arbetet ska ingå att forskningsavdelningen ansvarar för att så fort som möjligt harmonisera fältstrukturen i befintliga föremålsdatabaser samt att standardisering med övriga naturvetenskapliga museer inom landet så långt möjligt genomförs.
6. En kartläggning av samtliga samlingsrelaterade databaser ska genomföras. Med grund i denna ska tekniska stödfunktioner till befintliga samlingsdatabaser (backup, drift) ska samlas inom administrativa avdelningen som ska delta aktivt i arbetet. Inga separatlösningar för tekniskt stöd ska förekomma inom museet. De resurser som finns tillgängliga för utveckling och underhåll av databaser ska kraftsamlas för att definiera och implementera ett gemensamt system.
IRIS (Informationssystem för RIksmuseets Samlingar) Arbetet med att genomföra ett samlat system på Naturhistoriska riksmuseet System byggt på öppen källkod och utvecklat tillsammans med andra Huvudsakligen intern finansiering DINA (Nationellt system för DIgitalisering av NAturhistoriska samlingsdata) Fortsatt samarbete mellan Naturhistoriska museet i Göteborg, Herbarium Göteborg och Evolutionsmuseet i Uppsala (DINA-gruppen) Nationellt och internationellt samarbete Huvudsakligen extern finansiering (Artdatabanken)
IRIS genomförande Öppen källkod Vi utvecklar själva i samarbete med etablerade projekt (till exempel Specify, Morphbank, Pluto-F/Unite Estland) Samlingshantering – inte bara observationsdata Vi söker ett nordiskt – baltiskt utvecklingsamarbete där DINA är en viktig del Standardiseringsarbetet fortsätter (datamodeller och gränssnitt för föremålsdata, lån etc; utgår från ENSE) Samma tekniska baksida för alla enheters databassystem (SQL-databas, antagligen MySQL) Klienterna samma som förut i övergångsskedet om så önskas och det är tekniskt möjligt
IRIS genomförande (forts.) Enheterna behåller kontrollen över klienterna om de vill men krav införs på gemensamma standardiserade tabeller, tekniskt gränssnitt Framtida klienter: JAVA (tjock klient) och/eller PHP/Ruby on Rails (tunn klient) – utvecklas centralt och lokalt Genomförs stegvis: zoologi, botanik, paleontologi, geologi, MSL – alternativt baserat på intresse Databasansvariga på enheterna viktiga framför allt vid migreringen och anpassningen till det nya systemet Data pockas ur den gemensamma SQL-databasen för olika ändamål (resultatuppföljning, uppföljning av bevarandearbetet, GBIF-noden, K-samsök, museets presentation för allmänheten, länk till Artportalen) Klart till 2013 – men beroende på extern och intern finansiering mm
FileMaker Access NRM Klient Databas GBIF-SE GBIF Databas (SQL) Web Services Paradox
Specify Access FileMaker NRM SQL-databaser med vissa gemensamma tabeller K-Samsök GBIF Fjärrklienter (t ex amatörer) Webb-klienter
IRIS organisation Projektledare FR, chefutvecklare 100 % Torsten Eriksson Styrgrupp (FA-CK, Mats Lund, Eva Stengård, Sven Kullander) Arbetsgrupp (databasansvariga på enheterna) Teknisk referensgrupp (Lars Höglund, Mickaël Graf, ? KTH) Delmängd av DINA, som drivs tillsammans med Evolutionsmuseet i Uppsala, Göteborgs herbarium och Naturhistoriska museet i Göteborg Mesta arbetet drivs i delgrupper. Fri tillgång till information om arbetet, tillgång till minnesanteckningar och andra dokument som produceras på DINA-projektets webb-plats (www.dinaprojektet.se).
Bildlagring NRM installerade Morphbank sept. 2009, testning och driftsättning i år Morphbank: likt Genbank men för föremålsbilder, distribuerat nätverk av bilddatabaser NRM försöker skapa ett nordiskt-baltiskt konsortium av Morphbank-speglar för effektiv och billig lagring av biologiska bilder Motsvarande lösningar för geologiska bilder kommer att undersökas
IPR (rättigheter) All information görs tillgänglig på nätet (undantag hotade arter och liknande) Bilder görs tillgängliga i full upplösning utan restriktioner (vattenmärken och liknande) Rättigheterna regleras med licenser från Creative Commons Materialet fritt tillgängligt för icke-kommersiellt och kommersiellt bruk med angivande av källa.
Standardisering Bygger på tidigare insatser: ENSE, DINA Följer internationella och nationella standarder: Darwin Core, ABCDEFG, Common Data Model (EDIT), K-samsök, etc Öppet arbete: alla kan följa med, alla kan bidra (se www.dinaprojektet.se). Nya standarder eller rekommendationer (best practices) fattas av DINA-gruppen
På gång Kevin Holston och EN utvärderar Specify 6.0 och Morphbank: Kontrakt med ISIT Migrering av data har kommit långt Lånehantering och bilder på gång, fjärranslutna klienter kvar Vetenskapliga namn knyts till Catalog of Life Torsten Eriksson studerar och utvärderar datamodeller och system på NRM, nationellt och internationellt Öppet möte fredag 17 september kl. 14.30 i MIN-LIG seminarierum 15 november: IRIS styrgrupp fattar beslut om tekniska grundspecifikationer för IRIS 24 november: DINA-styrgruppen fattar beslut om tekniska grundspecifikationer för DINA
Tålamod! Förändringarna genomförs med små interna resurser Vi lovar inte hålla någon speciell tidtabell, det tar den tid det tar Vi jobbar i samarbete med DINA-gruppen och andra informatikprojekt men behåller möjligheten att gå vår egen väg Vi vill behålla det lokala initiativet och inflytandet så långt det går men behöver enas om gemensam teknik