Presentation laddar. Vänta.

Presentation laddar. Vänta.

18/09/00 V AD FINNS GÖMT BAKOM DET VI SER PÅ WEBBSIDAN? Materialet finns tillgängligt på URL Helena Francke, 18/09/00.

Liknande presentationer


En presentation över ämnet: "18/09/00 V AD FINNS GÖMT BAKOM DET VI SER PÅ WEBBSIDAN? Materialet finns tillgängligt på URL Helena Francke, 18/09/00."— Presentationens avskrift:

1 18/09/00 V AD FINNS GÖMT BAKOM DET VI SER PÅ WEBBSIDAN? Materialet finns tillgängligt på URL Helena Francke, 18/09/00 This Is Where We Came In Alan Ayck- bourn I

2 18/09/00 Innehåll… f.m 7 Olika format / kodning (PDF, HTML, XML) 7 Validering 7 Metadata 4HTML 4Dublin Core 4PICS 4RDF

3 18/09/00 Filformat Plattformsoberoende htmljpeg pdfwav gifm fl Proprietära docai pptpct cdr

4 18/09/00 Filformatet kan ha betydelse för kvalitén.. 7 hur tolkar webbläsare / program filen? 7 portabilitet 7 bevarandeaspekten 7 manipulation (kan vara av godo) / adaption

5 18/09/00 Skilda principer för textbeskrivning 7Textens stukturella uppbyggnadstukturella 4HTML 7Textens semantiska betydelse (descriptive markup) 4SGML, XMLXML 7Textens visuella representationvisuella 4PDFPDF Text används här i en vid bemärkelse

6 18/09/00 Exempel på uppmärkning Ur Alan Ayckbourns This Is Where We Came In: Uncle O […] And the princess, as soon as she saw the young prince, fell immediately in love with him… Nell (falling immediately in love) Oh!

7 18/09/00 Exempel på visuell kodning Ur Alan Ayckbourns This Is Where We Came In: Uncle O […] And the princess, as soon as she saw the young prince, fell immediately in love with him… Nell (falling immediately in love) Oh!

8 18/09/00

9 HTML  märkord (taggar) som märker upp strukturen  märker upp ren text (ASCII)  webbläsaren omvandlar koderna till presentationsinstruktioner alt. har man möjlighet att specificera layout- instruktioner - i html-koden eller separat (i t ex en stilmall [css, xsl])  bygger på SGML

10 18/09/00 Descriptive Markup 7 kodar efter innehåll likväl som struktur 7 SGML/XML 7 W3C (World Wide Web Consortium) W3C 7 utifrån SGML + XML skapar man nya uppmärkningsspråk som beskrivs i en DTD (Document Type Definition)DTD

11 18/09/00 UPPMÄRKNINGSSPRÅK (Markup Languages) SGML (Standard Generalized Markup Language) XML (eXtensible Markup Language) HTMLTEIMathMLRDF m fl

12 18/09/00 "Extensible Markup Language (XML for short) is a new language designed to […] make information self- describing. This simple-sounding change in how computers communicate has the potential to extend the Internet beyond information delivery to many other kinds of human activity. Indeed, since XML was completed in early 1998 by the World Wide Web Consortium […] the standard has spread like wildfire though science and into industries ranging from manufacturing to medicine.” Jon Bosak and Tim Bray (1999), "XML and the Second-Generation Web” // Scientific American

13 18/09/00 Val av format 7 Portabilitet 7 Manipulation 7 Sökbarhet 7 Utprodukt 7 Navigering (XLink, XPointer) 7 Belastning på nät / servrar 7 Vilken version är det? 7 DOCTYPE-deklarationen DOCTYPE-deklarationen 7 Följer koden i html-/ xml-filen W3C:s rekommendationer? 7 Validering

14 18/09/00 Vad är metadata? 7 data om data, eller 7 (strukturerad) information om olika resurser eller objekt, eller 7 uppgifter som möjliggör för oss att identifiera, lokalisera och organisera (digitala) resurser i lokala eller distribuerade samlingar Meta- (fr. grekiska): med, emellan, efter...

15 18/09/00 Uniform Resource Locator (URL) protokoll toppdomän katalog (mapp) filextension (HyperText Transfer Protocol) domän

16 18/09/00 Identifikatorer 7 URL - Uniform Resource Locator 7 URI - Uniform Resource Identifier 7 URN - Uniform Resource Name URN:NBN:se-d PURL - Persistent URL 7 DOI - Digital Object Identifier /[ISBN]

17 18/09/00 Dold metadata 7 exempelvis titeln på en bok, en MARC-post, materialinformationen i skor etc 7 kan finnas i/på objektet (skoexemplet) eller separat från detta (MARC-posten) 7 HTML, Dublin Core, PICS, RDF 7 används för att förbättra SÖKNING, LOKALISERING och SELEKTION

18 18/09/00 HTML-meta 7 (skilj mellan titel och rubrik!) - det enda obligatoriska metadata-elementet i html 7 ofta använt för att ange ämnesord och sammanfattning 7

19 18/09/00 Dublin Core Metadata Element Set 7 Grunden lades vid ett möte i Dublin Ohio DC är väl lämpat att beskriva dokument och dokument-liknande objekt 7 Målet var att skapa ett system 4som gör metadata enkelt att skapa och hålla aktuellt 4som är internationellt gångbart 4som är töjbart 7 En av begränsningarna med DC idag är att man inte anger någon typ av inmatningsregler - jmf KRS

20 18/09/00 Unqualified DC (1.1)DC 15 olika fält: 4INNEHÅLL: DC.Title, DC.Subject, DC.Description, DC.Source, DC.Language, DC.Relation, DC.Coverage 4UPPHOV: DC.Creator, DC.Publisher, DC.Contributor, DC.Rights 4IDENTIFIKATION, TID OCH TEKNIK: DC.Date, DC.Type, DC.Format, DC.Identifier Inget fält är obligatoriskt Alla fält kan upprepas vid behov

21 18/09/00 Qualified DC 7 TYPBETECKNINGAR Precisering av en kategori under rubriken och/eller en tillfogad uppgift med särskild innebörd. 7 SCHEME-TILLÄGG Precisering av en standard eller praxis som styr utformningen av fältets innehåll. efter Sten Hedberg (1999), ”Dublin Core i Sverige - en minsta gemensam nämnare eller…?” // Human IT nr 4/99

22 18/09/00 DC forts. 7 Hur tillämpas DC idag? - i ett stort antal projekt världen över som ofta är initierade från bibliotekshåll och inom söktjänster som inriktar sig på resurser inom en viss disciplin - i Sverige: Svesök, SAFARI, Svenska miljönätet (Nordic Web Index)SvesökSAFARISvenska miljönätet 7 DC-formulär skapat av NetLab vid Lunds UB finns på: 7 DC har än så länge dåligt stöd i de kommersiella söktjänsterna

23 18/09/00 PICS - Platform for Internet Content Selection 7 Utvecklades ursprungligen under influens av den diskussion som förts i USA kring the Telecommunications Decency Act 7 Utvecklades av W3C -rekommendationerna kom Metod eller infrastruktur, inte i sig ett system för klassificering/värdering 7 Olika system/vokabulärer för värdering skapas av organisationer eller individer 7 Du instruerar sedan webbläsaren att kontrollera informationen i dokumentet eller en databas (i IE 5.0 under Verktyg  Internet-alternativ  Innehåll) 7 Kan användas till annat än att värdera sex, våld och språk...

24 18/09/00 ”label list” för två dokument (PICS-1.1 "http://www.gcf.org/v2.5" by "John Doe" labels on " T08: " until " T23: " for "http://w3.org/PICS/Overview.html" ratings (suds 0.5 density 0 color/hue 1) for "http://w3.org/PICS/Underview.html" by "Jane Doe" ratings (subject 2 density 1 color/hue 1)) från ”PICS Label Distribution Label Syntax and Communication Protocols”

25 18/09/00 Resource Description Framework  RDF 7 Används för att ”samla ihop” metadata (t ex DC och PICS) i ett elektroniskt dokument 7 W3C-rekommendation i feb/mars RDF är ett XML-språk 7 En RDF-sats innehåller tre delar: 4en resurs (en URI) 4en egenskap (t ex ”författare”, ”titel”) 4ett värde (t ex ”Astrid Lindgren”)

26 18/09/00 RDF-exempel Klara Karlsson T14:00z Bengt Bengtsson

27 18/09/00 A TT HITTA INFORMATIONEN... KRITISK BEDÖMNING AV SÖKVERKTYG

28 18/09/00 Innehåll… e.m 7 Olika typer av sökverktyg - hur fungerar det? 7 Sökstrategier 7 Jämförelse av sökverktyg

29 18/09/00 Sökverktyg på webben 7 Sökmaskiner (t ex AltaVista, Excite, Google) 7 Ämnes- eller länkkataloger (t ex Yahoo!, Svesök, BUBL link) 7 Metaindex (t ex MetaCrawler, Mamma) 7 Klientbaserade metaindex (t ex Copernic) 7 Intelligenta agenter

30 18/09/00 Sökmaskiner 7 samlar in information på maskinell väg 7 en robot 4depth-first 4breadth-first 7 ett index 4inverterade filer 7 en databasmotor A U R L: er Z A U R L: er Z robot depth-firstbreadth-first hämta + lämna URL:er hämta URL:er lämna URL:er

31 18/09/00 Kataloger 7 hierarkiskt organiserade ämnesuppställda kataloger över länkar som går till andra webbresurser 7 sammanställs av människor 7 bygger på någon typ av klassifikationssytem - kan vara ett etablerat (t ex SAB, Dewey) eller egenproducerat (Yahoo!, SUNET:s katalog) ”Three possible strategic responses [to the reduction of intellectual and physical barriers brought about by the rise of multidisciplinarity and by the influence of computerization] are described: 1) adopting an existing system; 2) adapting an existing system; and 3) finding new structural principles for classification systems.” Clare Beghtol 1998, s 89 7 länkarna kvalitetsbedömda?

32 18/09/00 Andra varianter 7 Hybrider (katalog + sökmotor) 7 (trend: portaler) 7 Metaindex (söker i flera söktjänsters index samtidigt) 7 Klientbaserade metaindex 7 Intelligenta agenter

33 18/09/00 Sökstrategier 1 7 SÖKMASKINER 4objekt med signifikant namn - ”Bill Clinton”, ”IFLA” person/organisation/företag/märke/geografisk plats 4väl avgränsat område med karaktäristiskt namn - ”XML” 4”litet” område med väl definierad terminologi - ”mimesis” 4område som är svårt att placera in i en hierarki (t ex multidisciplinära) - ”malört” 4det är alltid en avvägning (jmf Massachusetts Institute of Technology/MIT)

34 18/09/00 Sökstrategier 2 7 KATALOGER 4överblick över vad som finns inom ett område 4om man är osäker på lämpliga söktermer, t ex söker inom ett obekant område (måste dock kunna identifiera lämplig kategori) 4kvalitetsgranskade resurser (ibland) 4resurser till en viss målgrupp - t ex barn (Länkskafferiet, SAFARI har möjlighet att avgränsa efter målgrupp) fler termer ger bättre precision än få - begränsa sökningen genom att lägga till termer, utvidga den genom att ta bort termer

35 18/09/00 Att jämföra sökverktyg precision = antal hittade relevanta dokument totala antalet hittade dokument recall = antal hittade relevanta dokument antal relevanta dokument i databasen

36 18/09/00 Sökmaskiner (1) OMFÅNG: 7 Storlek - hur många webbsidor / filer indexeras? (Google 560 miljoner webbsidor juli 2000) 7 Hur stor del av filen indexeras? (fulltext?) 7 Geografisk avgränsning? int/sv/landsspecifik? 7 Språk - i gränssnittet och i tillåtna söktermer GRÄNSSNITT: 7 Effektivt eller plottrigt? Reklam? Andra tjänster?

37 18/09/00

38 Sökmaskiner (2) PRODUCENT: 7 Vem står bakom tjänsten? kommersiell / ideell? 7 Kostnad? Teknik: 7 Efter vilka principer arbetar roboten? 7 Hur ofta besöks varje webbsida? Hur ofta uppdateras indexet? Finns materialet cachat? 7 Om tjänsten inte har eget index - från vem köper de tjänsten? 7 Strategier för att matcha fråga - dokument. 7 Hur värderas/rankas/viktas söktermerna? Premieras uppgifter i metadata? 7 Sökhastighet? 7 Finns någon kvalitetsgranskning / krav? (innehåll eller teknik?)

39 18/09/00 Sökmaskiner (3) SÖKNING: 7 enkel och avancerad sökning ”” 7 Boolesk logik 7 vad är standardinställningen? t ex OR, AND - går det att få reda på 7 trunkering, maskering 7 närhetsoperatorer 7 naturligt språk (kan du t ex formulera din sökning som en vanlig fråga? AltaVista, Ask Jeeves) 7 case sensitivity 7 avgränsningar (datum, format, språk, geografisk tillhörighet) 7 går det att ange var i filen du vill utföra sökningen? (titel, URL, länkar…) 7 söker den automatiskt på synonymer? 7 viktas termerna? 7 accepteras felstavningar? 7 att söka på annat än text-filer (bilder, ljud, animationer, applikationer mm) 7 diskussionsgrupper, mailinglist- arkiv mm 7 finns möjlighet att filtrera träffarna?

40 18/09/00 Sökmaskiner (4) TRÄFFLISTA: 7 Hur många träffar visas? Går det att påverka? 7 Hur mycket och hur relevant information får man om de olika träffarna? Går typen av information att påverka? 7 ”more like this” 7 Kan man få se endast 1 träff/server? Kan denna funktion stängas av? 7 Träffkvalitet (precision) 7 Hjälpsidor - är de informativa och lätta att förstå? Finns all information man behöver?

41 18/09/00 Specifikt för kataloger… (1) OLIKA TYPER: 7 universella (t ex Yahoo!, LookSmart, Magellan, BUBL Link) 7 ämnesinriktade (t ex de svenska ansvarsbibliotekens Samweb, Humweb etc, SOSIG, ARGOS, NOVA Gate, Svenska miljönätet - se lista över ”Subject Based Information Gateways” GateSvenska miljönätet 7 nationella / internationella 7 särskild målgrupp (forskare, barn…)

42 18/09/00 Kataloger (2) 7 Hur är katalogen organiserad? 4eget klassifikationssystem? Fungerar det? 4etablerat system? Är det ett system du känner till? 7 Hur många hierarkiska nivåer finns? Är de uttömmande eller är strukturen för grund? 7 Antal kategoriserade resurser 7 Hur har dessa samlats in? 7 Vilka kvalitetskriterier / urvalsprinciper tillämpas? 7 Hur noggrant är resurserna katalogiserade? Manuellt utvunna metadata som förbättrar sökresultat och träfflisteinfo? 7 Hur kan man söka i katalogens databas? (jmf sökmaskiner) 7 Kan man söka mha kontrollerad vokabulär från ämnesords- lista (SAB, MESH, LCSH)?

43 18/09/00 Tips... Bakgrundsinfo och jämförelser mellan olika söktjänster finns bl a på: 7 SearchEngineWatch har även gratis nyhetsbrev man kan prenumerera på 7 Search Engine Showdown har bl a aktuell statistik

44 18/09/00 Hitta de söktjänster som passar dig Testa nya tjänster någon gång då och då - utvecklingen sker snabbt! Ge inte upp! Testa en annan söktjänst om du inte får träff i den första. Välj ut några söktjänster som du lär dig ordentligt Några hurtfriska råd på vägen... Lycka till!


Ladda ner ppt "18/09/00 V AD FINNS GÖMT BAKOM DET VI SER PÅ WEBBSIDAN? Materialet finns tillgängligt på URL Helena Francke, 18/09/00."

Liknande presentationer


Google-annonser