Presentation laddar. Vänta.

Presentation laddar. Vänta.

EXtensible Markup Language Digitalisering av kulturarvet

Liknande presentationer


En presentation över ämnet: "EXtensible Markup Language Digitalisering av kulturarvet"— Presentationens avskrift:

1 eXtensible Markup Language Digitalisering av kulturarvet david.gunnarsson@hb.se

2 XML Utökar begränsningarna för vad som är möjligt, jämfört med SGML (och fr.a. HTML) –därigenom ökar förutsägbarheten Beskrivna dokumentmodeller (dvs DTDer) inte längre absolut nödvändiga -> ett dokument är giltigt (valid) eller välformat. Har genererat en stor mängd nya tillämpningar

3 XML-teknik XML Xlink & XPointer XSL: –XSLT –XPath –XSL-FO

4 XML Egentligen inget eget märkspråk, snarare syntaktiska regler för konstruktion av märkspråk (eller märkscheman) Med XML kan vi själva skapa olika märkscheman för olika syften Mer makt åt oss textproducenter

5 XML Ingen "äger" XML – plattformsoberoende Stöd (dvs XML-parser) i yngre webbläsare, fr.a. MS IE W3C: HTML, XHTML, XML, CSS, validering

6 "barn" till SGML TEI (1988) (språkvet., litteraturvet.) EAD (arkiv o museer) DocBook (akademiska texter) HTML XML

7 SGML - HTML, XML - XHTML specificitet generalitet SGML (1986) HTML (ca 1992) XML (1998) XHTML (2000)

8

9 XHTML HTML omdefinierad som en XML-tillämpning Skillnader HTML ↔ XHTML –utbyggbart –egna märken –krav på giltigt, välformat –exakthet i notationen –versaler/gemener –tomma element måste vara stängda

10 Grundläggande komponenter i ett XML-dokument Prologen Element Attribut och attributvärden Entiteter (CDATA i kommentarer)

11 Processinstruktioner, dokumenttypsdeklarationer

12 Prologen This Be The Verse They fuck you up, your mum and dad. They may not mean to, but they do. They fill you with the faults they had And add some extra, just for you. …

13 Element Par: Undantag tomma element: Versaler / gemener

14 attribut This Be The Verse They fuck you up, your mum and dad. They may not mean to, but they do. They fill you with the faults they had And add some extra, just for you. …

15 ett eller flera attribut

16 Entitetsreferenser LE BATEAU IVRE Comme je descendais des Fleuves impassibles, Je ne me sentis plus guidé par les haleurs: Des Peaux-rouges criards les avaient pris pour cibles, Les ayant cloués nus aux poteaux de couleurs. …

17 entiteter En viss teckensekvens har fördefinierats (i DTD:n) och givits ett namn. Vanligen för att representera tecken som annars kan "riskeras" Ibland även för att generera kortare eller längre text: genom att bara referera till namnet komprimerar man koden och spar arbete Refererar till externa data såsom grafik Behövs inte minst när märkenas och elementinnehållens notation kolliderar (<)

18 Entitetsexempel é = é = é ü = ü = ü &kontakt; = referens till en textsträng i DTD:n, i det här fallet ett namn på den aktuella kontaktpersonen &introduktion I DTD:n:

19 Kommentarer This Be The Verse They fuck you up, your mum and dad. They may not mean to, but they do. They fill you with the faults they had And add some extra, just for you. Man hands on misery to man. It deepens like a coastal shelf. Get out as early as you can, And don't have any kids yourself.

20 Kommentera bort kod This Be The Verse They fuck you up, your mum and dad. They may not mean to, but they do. They fill you with the faults they had And add some extra, just for you. --> Man hands on misery to man. It deepens like a coastal shelf. Get out as early as you can, And don't have any kids yourself.

21 Rotelement This Be The Verse They fuck you up, your mum and dad. They may not mean to, but they do. They fill you with the faults they had And add some extra, just for you. Man hands on misery to man. It deepens like a coastal shelf. Get out as early as you can, And don't have any kids yourself.

22 Ett XML-dokument kan vara välformat eller giltigt

23 Välformad XML Versaler / gemener Minst ett element Alltid ett rotelement Elementen bäddas in i strikt hierarkiska strukturer (OHCO) – tänk träd och filstrukturer Elementnamnen i start- och slutmärke matchar varandra Attributnamn förekommer blott en gång i startmärket Attributvärden inom citattecken Attributvärden refererar inte till externa entiteter (annat än till DTD:n) Entiteter deklareras

24

25 Välformad XML Philip Larkin

26 Giltig XML En välformad XML-fil som använder en dokumentypsdeklaration för att referera till en DTD och sedan följer denna DTD

27 1. Philip Larkin 2. Philip Larkin 3. Philip Larkin 4. Philip Larkin

28 1. Philip Larkin 2. Philip Larkin 3. Philip Larkin 4. Philip Larkin

29 1. Philip Larkin 2. Philip Larkin 3. Philip Larkin

30 Giltig XML En välformad XML-fil som använder en dokumentypsdeklaration för att referera till en DTD och sedan följer denna DTD

31 Dokumenttypsdeklaration referens till rotelementet TEI.2 publik identifierare + backup dvs. en referens till en särskild dtd-fil med deklarationer av TEI-dokumentets element, attribut och entiteter

32 *

33 Dokumenttypsdeklaration referens till rotelementet TEI.2 publik identifierare + backup referens till en särskild dtd-fil med deklarationer av TEI-dokumentets element, attribut och entiteter

34 En simpel DTD Philip Larkin DTD:

35 Innehållsmodellen #PCDATA EMPTY andra element blandat innehåll

36 Notation i DTD:n Se övningsmaterialet, bl.a. en bilaga

37 Problem med DTD:er annan notation än XML krångligt, särskilt med externa entiteter (bilder etc) emellertid är XML-världen på väg att lämna DTD:er för XML-scheman och för er finns också en redan färdigskriven DTD i TEI Lite

38 Verktyg Kommersiella redigeringsverktyg "Fria" verktyg –Anteckningar (ingen validator) –JEdit (validator) –Emacs m fl MS IE Explorer (parsern "validerar")


Ladda ner ppt "EXtensible Markup Language Digitalisering av kulturarvet"

Liknande presentationer


Google-annonser