Beständiga identifikatorer med tillhörande uppslagstjänster! Peter Hansson Bibliotekssystem och utveckling, Chalmers bibliotek (peter.hansson@chalmers.se) 2006-11-09
Beständig identifikator En unik symbol som fastställer identiteten av resursen som bär det. Symbolen ska vara konstant och finnas för evigt (eller åtminstone under lång tid). ex. personnummer, ISBN, URN:NBN... ISBN:91-44-03700-7 urn:nbn:se:uu:diva-3475 dokument
Exempel beständiga identifikatorer Handle System Handle används av DSpace ex. 2077/554 DOI (Digital Object Identifier) ex. 10.1000/182 URN:NBN ex. urn:nbn:se:vxu:diva-2 PURL (Persistent URL) ex. http://purl.org/dc/elements/1.1/ ...
Varför inte använda URL? Ett företaget köper ett nytt dokumenthanterings-system och dokumenten måste flytta från domänen foretag.se till foretag.se/nyplats. URL för varje dokument ändras. Företaget köps upp och det gamla företagsnamnet/märket skrotas. Företagsledningen bestämmer att domännamnet nyttforetag.se ska användas istället. Domännamnet i URL:en ändras. Företaget går så småningom i konkurs. Domännamnet nyttforetag.se blir ledigt (och till salu). URL:erna försvinner helt.
URL I RFC 1738 “Uniform Resource Locators (URL)” daterad december 1994 skrev Tim Berners-Lee mfl: “Users should beware that there is no general guarantee that a URL which at one time points to a given object continues to do so, and does not even at some later time point to a different object due to the movement of objects on servers.”
URN:NBN
URN RFC 2141 URN Syntax ”Uniform Resource Names (URNs) are intended to serve as persistent, location-independent, resource identifiers and are designed to make it easy to map other namespaces (which share the properties of URNs) into URN-space.” Syntax: <URN> ::= "urn:" <NID> ":" <NSS>
NBN RFC 3188 Using National Bibliography Numbers as Uniform Resource Names “This document discusses how national bibliography numbers (persistent and unique identifiers assigned by the national libraries) can be supported within the URN (Uniform Resource Names) framework and the syntax for URNs defined in RFC 2141.”
Giltiga URN:NBN URN:NBN:<ISO 3166 landskod>-<tilldelad NBN-sträng> Ex. URN:NBN:se-2006-1 URN:NBN:<ISO 3166 landskod>:<undernamnrymd>- <tilldelad NBN-sträng> Ex. URN:NBN:se:slu:epsilon-2 URN:NBN:se:vxu:diva-2 URN:NBN:no:ntnu:diva-214 URN:NBN:de:gbv:089-3321752945 URN:NBN:<annat registrerat prefix>-<tilldelad NBN-sträng>
Uppslagstjänster Resolution Service (eng) Ge uppslagstjänsten en beständig identifikator och uppslagstjänsten vet var resursen för tillfället finns. Jmf bibliotekskatalog (placering, URL)
Uppslagstjänst (1) VAR FINNS RESURSEN (DOKUMENTET) MED IDENTIFIKATOR X? identifikator adress(er) Uppslagstjänst HÄMTA RESURSEN (DOKUMENTET) MED HJÄLP AV ADRESSEN. ISBN:91-44-03700-7 adress urn:nbn:se:uu:diva-3475 dokument
Webbaserad uppslags- tjänst GE MIG RESURSEN (DOKUMENTET) MED IDENTIFIKATOR X. Webbaserad uppslags- tjänst identifikator identifikator adress(er) Uppslagstjänst dokument ISBN:91-44-03700-7 urn:nbn:se:uu:diva-3475
Konkret exempel Ge mig resursen med identifikator URN:NBN:se-2006-1?
KB:s uppslagstjänst för URN:NBN http://urn.kb.se/
Vilka resurser kan KB:s uppslagstjänst hitta? Användaren kan vidarebefordras till resurser som den lokala uppslagstjänsten har information om som registrerats hos andra kända uppslagstjänster som blivit tilldelade andra typer av beständiga identifikatorer (doi, handle) och uppslagstjänsten är känd En lista över kända uppslagstjänster administreras idag av Enheten för digital publicering, Uppsala universitetsbibliotek http://epc.ub.uu.se/rs/services/servicemappings.xml
Direktlänkar (1/3) http://urn.kb.se/resolve ?urn=URN:NBN:se-2006-1 http://urn.kb.se/resolve ?urn=urn:nbn:de:gbv:089-3321752945
Direktlänkar (2/3) http://urn.kb.se/resolve ?doi=10.1016/S0021-9797(03)00401-6 http://urn.kb.se/resolve ?hdl=10.1045/may2001-kahn
Direktlänkar (3/3) http://urn.kb.se/resolve ?method=getownername &identifier-pattern=urn:nbn:se:slu:epsilon- http://urn.kb.se/resolve ?method=isregistered &identifier-pattern=urn:nbn:se:solidaritetshuset-
Hur vet uppslagstjänsten adressen till resursen? Lokala arkiv och/eller publiceringssystem måste publikt visa vilka identifikatorer som blivit utdelade under deras undernamnrymd och vilka adresser som i dagsläget är giltiga. Jmf hur metadata görs tillgänglig via OAI-PMH (Kommer snart!).
Källfil (alt 1) Publiceringssystemet skapar/underhåller automatiskt en fil med alla relationer mellan utdelade identifikatorer (URN:NBN) och resursernas aktuella adresser (URL). Filen måste vara skriven i ett speciellt XML- format. Filen publiceras på nätet och blir tillgänglig via en vanlig URL. Innehållet som denna URL pekar mot kallas för en källfil. Sedan tar man kontakt med den organisation som tillhandahåller uppslagstjänsten och ber dem registrera källfilen i deras system. KB sköter registreringen i Sverige. Tjänsten kommer sedan automatiskt att med jämna mellanrum harvesta/hösta/läsa källfilen.
Källfil (alt 2) En fil med alla relationer mellan utdelade identifikatorer (URN:NBN) och resursernas aktuella adresser (URL) skapas/underhålls manuellt av en administratör. Filen måste vara skriven i ett speciellt XML- format. Filen publiceras på nätet och blir tillgänglig via en vanlig URL. Innehållet som denna URL pekar mot kallas för en källfil. Sedan tar man kontakt med den organisation som tillhandahåller uppslagstjänsten och ber dem registrera källfilen i deras system. KB sköter registreringen i Sverige. Tjänsten kommer sedan automatiskt att med jämna mellanrum harvesta/hösta/läsa källfilen.
Kontrollfunktioner Uppslagstjänsten kontrollerar att källfilen är tillgänglig när den ska läsas in Källans innehåll kontrolleras mot registrerade undernamnrymder Innan en slutanvändare vidarebefordras till en URL undersöker uppslagstjänsten om URL:en fungerar Felrapporter skickas automatiskt ut via e-post till berörda organisationer/personer (teknisk kontakt anges vid registrering).
Hands-on: Registrering av en undernamnrymd för Chalmers
Källfil från Chalmers
Om man inte vill ha en egen undernamnrymd Det går att skapa enstaka URN:NBN-identifikatorer Dessa enstaka identifikatorer hamnar i dagsläget inte under någon undernamnrymd utan direkt efter landskod. ex. URN:NBN:se-2006-1 Enstaka URN:NBN administeras helt och hållet av KB (med andra ord KB administrerar själv en källfil med mappningarna)
Mer info Registrering av URN:NBN, länkar till beskrivning av källfilens format http://www.kb.se/isbn/ Programvara för uppslagstjänst http://epc.ub.uu.se/niwiki/ Registrerade URN namespaces http://www.iana.org/assignments/urn-namespaces
OAI-PMH Open Archives Initiative Protocol for Metadata Harvesting Peter Hansson Bibliotekssystem och utveckling, Chalmers bibliotek (peter.hansson@chalmers.se) 2006-11-09
OAI (Open Archives Initiative) Stödjer och utvecklar interoperabilitetsstandarder för att underlätta spridning av information (framförallt vetenskaplig) Resultat hittills: OAI-PMH (Protocol for Metadata Harvesting) På gång: OAI-ORE (Object Reuse and Exchange)
Interoperabilitet ”Samordningsförmåga” Interoperabilitet på olika nivåer Protokoll Format (metadataformat, fulltextformat) (oai_dc, ?) Innehåll (skrivregler etc) OAI HAR LYCKATS VÄL! OAI HAR MISSLYCKATS! OAI HAR MISSLYCKATS!
OAI-PMH PMH = Protocol for Metadata Harvesting Använder ett annat standardprotokoll: HTTP (GET/POST requests) Alla svar levereras i XML-format Protokollet har stöd för flera metadataformat och rekommendationen är att åtminstone erbjuda ”unqualified/simple dublin core” OBS! Inget protokoll för sökning
Aktörer i OAI-PMH Data provider (”passiv innehållsleverantör”) Tillhandahåller metadata via OAI-PMH. Service provider (”tjänsteleverantör”) Tillhandahåller tjänster som bygger på det innehåll som skördas/hämtas från data providers via OAI-PMH.
System i OAI-PMH Repository – det nätverksanslutna datasystem som tillhandahåller metadata enligt protokollet OAI-PMH Harvester – en programvara som används av service provider för att samla in metadata från olika data providers
Aktörer och system Data provider Service provider Repository Harvester metadata (dokument) request (berikad) metadata response
Vad är sets? Publikationer Datavetenskap Avhandlingar Avhandlingar från Chalmers Examensarbeten Datavetenskap
OAI-PMH requests 6 st frågor (requests) definieras i protokollet Identify ListMetadataFormats ListSets ListIdentifiers ListRecords GetRecord
H A R V E S T R E P O S I T Y Service provider ”tjänsteleverantör” Data provider ”innehållsleverantör” H A R V E S T R E P O S I T Y
Identify http://publications. lib. chalmers. se/search/oai. jsp V E S T R E P O S I T Y Identify Namnet på förvaringsplatsen URL för anrop E-postadresser (admin) OAI-PMH version Beskrivning av förvaringsplatsen
ListMetadataFormats http://publications. lib. chalmers. se/search/oai V E S T R E P O S I T Y ListMetadataFormats En lista över xml-format som stöds
ListSets http://publications. lib. chalmers. se/search/oai. jsp V E S T R E P O S I T Y ListSets Lista över “sets” Kort namn Fullständigt namn Utförlig beskrivning
ListRecords http://publications. lib. chalmers. se/search/oai. jsp ListRecords http://publications.lib.chalmers.se/search/oai.jsp?verb=ListRecords&from= 2006-01-01&until=2006-06-01&set=svep:med&metadataPrefix=oai_dc ListRecords from=ÅÅÅÅ-MM-DD until=ÅÅÅÅ-MM-DD set=svep:med metadataPrefix=oai_dc H A R V E S T R E P O S I T Y Lista över poster identifikator datum(tillagd/ändrad/borttagen) namn på sets metadata
ListIdentifiers http://publications. lib. chalmers. se/search/oai. jsp from=ÅÅÅÅ-MM-DD until=ÅÅÅÅ-MM-DD set=svep:med metadataPrefix=oai_dc H A R V E S T R E P O S I T Y Lista över identifikator datum(tillagd/ändrad/borttagen) namn på sets
GetRecord http://publications. lib. chalmers. se/search/oai. jsp GetRecord http://publications.lib.chalmers.se/search/oai.jsp?verb=GetRecord& identifier=oai:publications.lib.chalmers.se:208&metadataPrefix=oai_dc GetRecord identifier=oai:publications.lib.chalmers.se:208 metadataPrefix=oai_dc H A R V E S T R E P O S I T Y En post identifikator datum(tillagd/ändrad/borttagen) namn på sets metadata
Lär dig mer Information, kurs http://www.oaforum.org/tutorial/ Organisationen OAI, OAI-PMH specifikationer, programvaror http://www.openarchives.org OAI Repository Explorer http://re.cs.uct.ac.za/
Tack för er uppmärksamhet! Frågor?