LÄNKADE GEODATA - PILOTSTUDIE
INNEHÅLL Vad är länkade data Länkade data inom PSI och INSPIRE Pilotprojektet Omvärldsanalys Nulägesanalys Fortsättningen
PRINCIPER FÖR LÄNKADE DATA Baseras på RDF (Resource Description Framework) (W3C- standard, första versionen från 1999) RDF är en modell baserad på tripletter. Kan illustreras som grafer eller serialiserat som RDF/XML eller RDF/JSON. Såväl noder som bågar bör bestå av unika identifierare på webben, URI:er Används exempelvis för att länka ihop (integrera) separata datamängder Många verktyg finns framtagna Ledord: Standarder, vokabulär
Strindberg ”August Strindberg” <
Fastighet Person Företag … … … Ägare
SKOS – EN STANDARD FÖR VOKABULÄR
PSI & INSPIRE Artikel 9 i PSI-direktivet (efter revideringen 2013): ”Where possible Member States shall facilitate the cross-linguistic search for documents” DCAT-AP är EU’s rekommendation för metadata för alla som publicerar öppna data. Den uppfyller dock inte INSPIRE’s lagstiftade krav. JRC arbetar med att utveckla GeoDCAT-AP. Det finns redan översättare från XML (ISO-19115) till GeoDCAT-AP (preliminär version). Endorsement process Juni – Oktober 2015.
LÄNKADE GEODATA / INSPIRE KONFERENSEN Phil Archer W3C OGC och W3C har en arbetsgrupp (Spatial data on the Web) SmOD ( specificerar förenklade INSPIRE XML scheman så att de passar ”tänket” inom semantisk webbhttp:// SKOS vokabulär för CORINE landcover (en av piloterna) Slovakien har provat att länka skyddade områden och förorenade områden med Geonames (databas med länkar till Dbpedia). Även Italien, Grekland och Tjeckien redovisade visa studier Det börjar komma verktyg för migrering från INSPIRE-GML till RDF/XML, exempelvis GeoKnow projektet Kodlistor, INSPIRE-register, vokabulär, GeoDCAT-AP ligger främst
LÄNKADE GEODATA - FÖRSTUDIE Delfinansierat av Vinnova Deltagare: Lantmäteriet (koordinator), SGU, MSB, Naturvårdsverket, Linköpings Universitet, FPX, Novogit Pågick Sept 2014 – April 2015 Långsiktiga mål Integrerade tjänster Effektivare databehandling
EUROPEISKA POLICIES OCH MÅL
SVENSKA INITIATIV
KRITISKA FRAMGÅNGSFAKTORER Överensstämmelse med affärsmodeller (vilka värden skapas, hur de levereras samt betalningsströmmar) Hantering av beständiga identifierare Tydliga tjänstenivåavtal (SLA) inkl ägarskap Enkelt att hitta, få tillgång till och använda data (licenser etc) Kvalitetssäkring av externa data som är länkade till de egna Standarder, vokabulär och ontologier Restriktioner på data (personlig integritet, sekretess) Verktyg ska vara enkla och överkomliga
FÖRVÄNTADE NYTTOEFFEKTER Enklare att förstå och använda externa data Effektivare databehandling, mindre redundans genom att man fokusera på de egna datamängderna Bättre synlighet och tillgänglighet på webben och i sökmotorer Högre grad av standardisering medför att effektivare processer kan utformas
EXEMPEL PÅ FÖRVÄNTADE NYTTOEFFEKTER DEFRA (UK) och OS (GB): Förbättrad transparens och stöd till innovation EULF (EU Location Framework): Bättre tillgång till data EEA: Förbättrad och effektivare databehandling Italien, Polen och Finland: Förbättrad synlighet i sökmotorer
OBSERVERADE NYTTOEFFEKTER Office for National Statistics (UK): Bättre tillgång till statistiska data (datamängder via geoportal, förekomster via RDF/XML) RAÄ: App-utveckling av externa aktörer (FornMap, används tyvärr inte så mycket för externa länkar saknas) BBC, Nobelstiftelsen etc: Effektivare databehandling, rikare egen webbsajt
NULÄGESANALYS Lantmäteriet: Vissa frågeställningar som licenser och beständiga id’n studeras. Annars bedöms länkade geodata inte vara strategiskt viktigt i nuläget. SGU: Arbetar idag med DCAT-AP, vokabulär / kodlistor och beständiga id’n. Har CC0-licens på data. Länkade geodata ligger helt i linje med SGU’s strategi, som baseras på regeringens strategi för e-förvaltning MSB: Vill vara med i en lärprocess samt kunna använda externa data mer effektivt Naturvårdsverket: Arbetar idag med DCAT-AP, vokabulär / kodlistor och beständiga id’n. Har CC0-licens på data. Anser att länkade data ligger i linje med myndighetens tjänsteutveckling, men vill gå långsamt fram.
FORTSÄTTNINGEN? Ansökningar? VINNOVA FRÖN under hösten? Horizon 2020 våren 2016? Utlysningen INSO-1: ICT enabled open government hade 25 maj 2015 som ansökningsdatum Utgiftsområde 22, anslag 2:6 – Gemensamma e-förvaltningsprojekt av strategisk betydelse, får en minskning i vårbudgeten med 35 Mkr. Grundfråga: Fördelar och begränsningar med integrering av Ej harmoniserade data INSPIRE-data (GML) Harmoniserade geodata i RDF Projektplanen är i dagsläget en önskelista
STRATEGIER FÖR LÄNKADE GEODATA Beständiga identifierare Licenser, SLA, dataleverantörernas ansvar Uppbyggnad av vokabulär
PROJEKTETS INFRASTRUKTUR Länkade geodata från SGU, RAÄ(ev) och SMHI (ev) Bearbetning av annan extern information (från LM, NV etc) Verktyg och processer för länkning av datamängder Verktyg för bearbetning av länkade data
ANVÄNDBARHETSSTUDIER Statistik om räddningsinsatser (MSB) Klimatanpassning hos länsstyrelser och kommuner (SGI) Användbarheten mäts i Måluppfyllelse Resursförbrukning Personlig tillfredsställelse Nyttoeffekter (användbarhet) kvantifieras med utgångspunkt från graden av standardisering hos datamängderna enligt 5- stjärnemodellen.