TEI Header Mats Dahlström Digitalisering av kulturarvet April 2007
Metadata Data om data // information om dokumentet bibliografiska data Metadata för –samlingar av dokument –ett dokument –ett dokumentsegment
Metadata / typ 1.Beskrivande metadata 2.Strukturella metadata 3.Administrativa metadata 4.Rättshanteringsmetadata 5.Arkivaliska metadata
Metadata / funktion Dokumentation Bibliografisk kontroll: –Identifiering och (fr.a. maskinell) återvinning av resurser –Organisering av resurser Interoperabilitet mellan system Rättigheter Bruksinformation Information till sökmaskiner Stöd för arkivering och bevarande Läs ”Minerva” om metadata!
Metadata / digitala objekt Synliga / dolda metadata Inbäddade / externa “Tryckta” standarder: behov av metadaformat anpassade till digitala objekt Flera försök att göra beskrivningen standardiserad, enhetlig, maskinläsbar (Dublin Core, PICS, TEI Header, RDF) Dåligt stöd för metadata i SGML och HTML
Syftar till att ge en beskrivning av framför allt den elektroniska resursen men också av dess källor Kraftfull och detaljrik, genom en stor uppsättning av både element och attribut Obligatoriska respektive valfria element Kap. 5 i Guidelines – kap. 20 i TEI Lite Kap 6 i övn.mtrl, inklusive figur bilaga D
… men då, med dess etc?
4 sektioner i TEI Header...
4 sektioner i TEI Header File description Encoding description Profile description Revision description
Obligatoriskt Full bibliografisk information om den elektroniska filen och dess källa/or Obligatoriska barnelement: – Valfria barnelement
/ Obligatoriskt Identifierar den elektroniska filen, inte dess källa/or Obligatoriskt barnelement: – Valfria barnelement, t.ex.: – [ dvs till verket, av vilket den elektroniska filen är en version ] – [ dvs om den elektroniska utgåvan ] – [ dvs för den elektroniska utgåvan ]
Author To Her Book: An Electronic Edition Anne Bradstreet Header creation by Ralph Bauer Encoded by Ann Hanlon
/ Obligatoriskt element Obligatoriskt innehåll: antingen en beskrivning av resursen eller minst ngt av barnelementen: – [förlag, organisation] – [individ(er), sällskap etc] – Annat: –
/ Obligatoriskt Identifierar källan/orna till den elektroniska filen Innehåller antingen beskrivning i text ( ) eller ett el flera av barnelementen: – [ dvs till verket, av vilket den elektroniska filen är en version ] – Ingen ”källa”?
The Works of Anne Bradstreet in Prose and Verse. Edited by John Harvard Ellis. (Charlestown: A. E. Cutter, 1867)
/ / Innehåller en egen lite full genomgång av TEI:s file description, men alltså denna gång för källresursen
4 sektioner i TEI Header File description Encoding description Profile description Revision description
Dokumenterar (val i) arbetet med den elektroniska texten och dess kod, t.ex. – (t.ex. normalisering av stavning, typ av rättelser införda) – (t.ex. märkfrekvenser) – (t.ex. den princip som valts för kapitelnumrering etc) – (t.ex. ett klassif.schema)
4 sektioner i TEI Header File description Encoding description Profile description Revision description
3 valbara barnelement: – (högst en) – – (enligt ) med barnelement, t.ex.:
4 sektioner i TEI Header File description Encoding description Profile description Revision description
En ”logg” för uppdateringar, revisioner och andra ändringar som har gjorts med den elektroniska resursen. Innehåller ett eller flera. Varje har: (ett eller flera) (textbeskrivning av vad som gjorts)
xxx ASM Header Edited unknown xxx JPW Basic Tei Lite tagging
TEI Headers kan … Utgöra egna XML-dokument Vara kraftfulla metadataresurser Översättas (t.ex. via XSLT) till andra metadatascheman, t.ex. Dublin Core eller MARC 21 –Cf ”arkiv” – ”leverans”