Enheten för bioinformatik och genetik DINA-projektet Fredrik Ronquist Enheten för bioinformatik och genetik
Enheten för bioinformatik och genetik (BIO) Enhetsledning Fredrik Ronquist (KÖL o Cosmonova) Pia Eldenäs (KÖL) Jane Parker (KÖL) Biodiversitets-informatik DNA-labbet Forskning Karin Karlsson Martin Irestedt Love Dalén Cosmonova-flygeln plan 6 KÖL plan 2, plan 3
IRIS (Informationssystem för RIksmuseets Samlingar) DINA (Digitalt Informationssystem för NAturhistoriska samlingsdata) Samarbete mellan Naturhistoriska riksmuseet (NRM), Göteborgs naturhistoriska museum (GNM), Herbarium GB (GB), Evolutionsmuseet i Uppsala (EMU) och Zoologiska museet i Lund Utveckla och implementera ett nationellt samlingshanteringssystem i internationellt samarbete Huvudsakligen externa medel (Artdatabanken) IRIS (Informationssystem för RIksmuseets Samlingar) Införandet av DINA på Naturhistoriska riksmuseet Naturhistoriska riksmuseets bidrag till DINA Huvudsakligen anslagsfinansierat
DINA (Digitalt informationssystem för naturhistoriska data) Web-baserat system för samlingshantering Bygger på öppen källkod Utvecklas av NRM i samarbete med internationella partners Utvecklingen utgår ifrån Specify och Morphbank Nationellt system i SE, EE, DK Lokalt system vid Canadian Museum of Nature (Ottawa), Museum für Naturkunde (Berlin) Förslag till konsortieavtal cirkuleras för närvarande bland partners Två systemversioner: ”DINA light”: Specify version 6 + Morphbank, inga NRM-resurser läggs på utvecklingen av denna version DINA Web: Helt web-baserat system, utvecklas till stor del av NRM men i samarbete med ett flertal internationella partners
DINA - kom ihåg ... Vi har valt att utgå från Specify och Morphbank för att dessa system är de bästa startpunkterna för utvecklingen av DINA Web – inte för att vi tycker att de är fulländade system Vi har valt öppen källkod och utveckling i internationell samverkan för flexibilitet, kostnadseffektivitet och långsiktig stabilitet - inte för att det nödvändigtvis är det snabbaste sättet att implementera ett nationellt samlingshanteringssystem Java-programmet (”tjocka klienten”) som används i ”DINA Light” bygger på gammal teknik och kommer att fasas ut över tid. Anledningen att vi inte vill modifiera Java-programmet är att vi måste fokusera våra resurser på att utveckla DINA Web - inte för att det skulle vara omöjligt.
DINA organisation Sverige Museum of Nature Ottawa, Canada NRM Specify team Kansas, USA FA styrgrupp Arbetsgrupp FA datasbasansvariga Natural History Museum, Tartu Museum für Naturkunde, Berlin DINA-SE utvecklingsteam DINA-DK utvecklingsteam DINA-SE styrgrupp DINA International Council
DINA-SE utvecklingsteam Karin Karlsson (50 %) Kevin Holston Markus Skyttner Ida Li Markus Englund (80 %) Ingimar Erlingsson
Två vägar in i DINA ”DINA Light” Anpassning, datatvätt och datamigrering Specify 6 Morphbank Mindre anpassning Nuvarande system DINA Web Anpassning av datamodeller och datatvätt Anpassning av gränssnitt och funktionalitet Datamigrering
”DINA Light” web-gränssnitt Morphbank web-klient centrala databaser och filarkiv Specify databas Morphbank databas Morphbank bildarkiv Specify 6 Java-program ”tjock klient” Ansluter innanför brandväggen eller via krypterad SSH-tunnel
DINA Web web-gränsnitt Java-program Samlings-hanteraren Inventerings-klienten DINA web-portal Svenska DNA-nyckeln Naturforskaren Specify databas Mediafiler metadatabas Mediafiler BLAST DB Taxon info Specify 6 Java-program Java-program
DINA Web, klienter Samlingshanteraren (”Specify Web”; demo-version finns, beta släpps våren 2014) Komplett system för professionell hantering av samlingar (föremål, lån, bilder etc) Avsedd för samlingspersonal och forskare Gränssnittet liknar det i Specify 6 Java-programmet, särskilt i de delar som utvecklas av Kansas; de delar som utvecklas av NRM kommer att vara DINA-anpassade från början Inventeringsklienten (”SMTP-klienten”; släpptes i dec. 2012) För forskare och samlingspersonal som sysslar med stora inventeringsprojekt Stora mängder material sorteras och bestäms kontinuerligt Behov av snabb digitalisering av stora mängder föremål Exempel: Markfaunainventeringen, Svenska Malaisefälleprojektet (”SMTP”) Naturarv.se (DINA web-portal; http://naturarv.se; smygsläpptes i maj 2013) Gemensam sökportal för DINA Avsedd för allmänhet och forskare utanför DINA men också användbar för DINA-personal för att få översikt, söka material, finna fel mm Stöd för felrapportering till ansvarig samlingspersonal Stöd för bilder, låneförfrågningar kommer i senare versioner
http://naturarv.se
DINA Web, klienter forts. Svenska DNA-nyckeln (släpps 21 jan. 2014) FORMAS-finansierat projekt; kopplingar till Centrum för Genetisk Identifiering Tillåter artbestämning baserat på gensekvenser mot svenska och internationella referensdatabaser (BOLD, GenBank) För svenska referensdatabasen kopplar den till voucher-information i DINA (kartor, bilder, samlingsdata mm) Kopplar till artinformation i Naturforskaren.se Naturforskaren.se (släpptes i nov. 2012; ny version i nov. 2013) EU-finansierat projekt (Central Baltic Interreg); samarbete med Finland och Estland Samlar populärvetenskaplig information om (nordisk-baltiska) arter Skördar information från och länkar till många andra system Taxonomimodulen som utvecklas i Estland kommer också att användas inom DINA Web
http://naturforskaren.se
Migrering till ”DINA Light” 2011 2012 2013 2014 2015 Föremål Entomologi NRM Lån Bilder Entomologi GNM Föremål Föremål Paleozoologi NRM Lån Föremål Paleobotanik NRM Mineralogi NRM Föremål Lån Föremål Geologi GNM Lån Geologi Paleontologi EMU Föremål Lån
Utveckling av DINA Web 2012 2013 2014 2015 2016 JPA-lager, REST-tjänster (NRM, Kansas) Samlingshanteraren (”Specify Web”) Specify Web Milestone 1 (Kansas) Specify Web Milestone 2 (Kansas, NRM, Tartu) Hantering av mediafiler (NRM) Extern taxonomihantering (Tartu) Sorteringshantering, v. 1 Inventeringsklienten (SMTP-klienten) Sorteringshantering, v. 2 Föremålshantering, v. 1 Naturarv.se, version 1 DINA Web-portal (Naturarv.se) Naturarv.se, version 2 DINA-flöde till GBIF Övrigt utvecklingsarbete Naturforskaren version 1 Naturforskaren version 2 Svenska DNA-nyckeln
Migrering till DINA Web 2012 2013 2014 2015 2016 Sorteringsfraktioner SMTP Artobservationer Föremålsdata Datatvätt, förberedelser för migrering Botanik NRM, EMU, GB Anpassning av gränssnitt o funktionalitet Migrering
Saknas i tidsplaneringen Zoologiska museet vid Lunds universitet Zoologiska samlingar vid GNM utom entomologi Botaniska samlingar i Lund och Umeå Vid NRM: Vissa zoologiska samlingar (evertebratzoologi, vertebratzoologi förutom barkodsdata) MFÖ (ringmärkningscentralen, miljöprovbanken, ev. pollendata) DNA-labbets prover, extrakt mm Gränssnitt för resultatrapportering Hantering av ABS-dokument Funktioner för skadedjurskontroll och för kvalitetsmått gällande samlingarnas bevarande
Nyfiken på DINA-arbetet? Kontakta DINA-gruppen på NRM (t ex Karin Karlsson) DINA projekt-wiki (http://dina-project.net): Info om DINA-projektet i Sverige och utomlands Protokoll från alla styrgruppsmöten Länk till filmer som visar Inventeringsklienten och Specify 6 (Java- programmet) Specify Web demo: http://dhwd99p1.nhm.ku.edu Naturarv: http://naturarv.se Naturforskaren: http://naturforskaren.se Specify workshop på NRM 16-18 oktober: 16-17 oktober för användare av Specify 6 (”Dina Light”) 18 oktober för allmänt nyfikna
http://dina-project.net
Massdigitalisering Vi har ca 25 M föremål i svenska naturhistoriska samlingar som ännu ej är digitaliserade Huvuddelen är botaniska samlingar (herbarieark) och insekter (torrsamlingar av nålade djur) I nuvarande takt tar det hundratals år innan allt är digitaliserat Kostnaden för traditionell digitalisering är stor (ca 50 kr/föremål för traditionell inknappning utan avbildning -> ca 1 250 M kr) Internationellt pågår flera projekt där nya tekniker används för att få ner kostnaden avfotografering i industriell skala OCR-läsning av etiketter, artificiell intelligens för tolkning ”crowd-sourcing” av tolkningen av etiketter GBIF försöker påskynda digitaliseringen genom att: Arrangera symposium tillsammans med Digisam om massdigitalisering av naturhistoriska samlingar (9 januari på NRM) Bedriva småskaliga pilotprojekt Förbereda ansökan till VR om massdigitalisering; lobbying mot regeringen Mer info: Anders Telenius, Stefan Daume