Relationen mellan IR och IE Upplägg Vad är informationsåtkomst (IR)? Skillnader mellan IR och IE Hur kan IR och IE kombineras? Hur har IR och IE kombinerats?

Slides:



Advertisements
Liknande presentationer
Olof Sundin, Fil dr Informationsstrategier och yrkesidentiteter - en studie av sjuksköterskors relation till fackinformation.
Advertisements

Svenska som andraspråk
Learning Study / Stöd för genomförande och dokumentation
Provbetyg – Slutbetyg Likvärdig bedömning? En statistisk analys av sambandet mellan nationella prov och slutbetyg i grundskolan,
Gymnasiearbetet Tekniker och resurser för informationssökning
Libris som mobilapplikation • Målgrupp • Specifikt mobil • Relaterat till researchprocessen • Kan sträcka sig en bit in i framtiden • Smartphones.
Samsökning – vad och varför. Vad innebär ordet? •Att söka i olika databaser eller andra källor •Att söka utan att veta var man söker •Att söka utan att.
Att söka och förvalta kunskap
© Anders Broberg, Ulrika Hägglund, Lena Kallin Westin, 2003 Datastrukturer och algoritmer Föreläsning
Bedömning av professionell kompetens
BEANS NÖJD KUND INDEX (e-survey undersökning)
Högskoleförberedelse
Muntligt Jag kan….
Intranät – inte för alla?
Formellt, skarpt och snyggt
Sammanfattning Vi gjorde ett studiebesök i Kista Service Hus. Två pensionärer pratade om problem i deras vardagsliv. Utifrån det tänker vi skapa en digital.
1 Logikprogrammering ons 11/9 David Hjelm. 2 Repetition Listor är sammansatta termer. De består av en ordnad mängd element. Elementen i en lista kan vara.
Startsidan ger kunskap Om vad som är möjligt att göra Och vem som står bakom. Blocken för ämne och organisationer Är klickbara och leder till sidan för.
Underordnade konjunktioner
Världens 7 underverk.
Luncha & lär! Indirekt tal ii.
LIKHETSTECKNET Learning study i skolår 6 och 7
Hur fungerar värdegrundsarbetet i vardagen, på operation 2010? På kliniken IVAK/OPERATION, startade ett värdegrundsprojekt Detta har lagt grunden.
- Vikten av att kunna sälja in sin idé
Kurslitteraturen består av 11 kapitel som var och en belyser olika delar av automatiseringstekniken. De utgör fristående delar men har en gemensam röd.
Ämne 1 Ämne 2 Ämne 3 Ämne 4 Ämne 5 Avsluta. Ämne 1 – 100 Frågan Svaret.
Svenska p Svenska p.
1. Detta är ett förslag på upplägg/rubriker som ni kan använda er av när ni ska dokumentera/presentera vad ni gjort i ert.
CINAHL Börja med CINAHL Headings för att hitta ämnesord.
Eller formativt lärande…
Läroplansträff Välkomna.
Patientupplevd vårdkvalitet
Algoritm analys och rekursiva metoder kap 5,7
STOCKHOLMS UNIVERSITETSBIBLIOTEK Te l e f o n v x l: F ax: w w w.s u b.s u.se Informationssökningskurs för doktorander Geobiblioteket.
Relationer skapas, upprätthålls och avbryts genom tal
Workshop inför Projektet
Pekare och speciell programstruktur i inbyggda system
Detection of similarity between documents Axel Bengtsson Ola Olsson
1. Uppgiften presenteras
Vektorer (klassen Vector) Sortering
Positiv Livskraft © Att komma dit du vill
Hur man skriver en argumenterande text.
Debattera.
Informationskompetens. Eleven ska kunna… orientera sig i en komplex verklighet med stort informationsflöde och snabb förändringstakt. Deras förmåga att.
Greppa Näringen Medlemsundersökning, kvartal 1. 1.
Outline för dagens övning
Frågor om elevinflytande till elever i åk 3 – 9 i grundskolan
©Else-Britt Hellström
Argumenterande text.
1(31) Ett omdiskuterat ämne. Vad är det som händer? 2.
Informationssökning i högskolebibliotekets databaser och på Internet
 Vad går uppgiften ut på?  Vilket ämne ska jag skriva om?  Vad vill jag veta?  Vilka frågor har jag?  Vad kan jag själv om detta?  Vad behöver jag.
Samhällsvetenskapliga metoder
Att lära sig att analysera
Logikprogrammering 21/10 Binära träd
Kan du omvandla 80 km/h till m/s?
En guide för arbeten i SO
Statsvetenskap 3, statsvetenskapliga metoder
Study Manager är en SharePoint-lösning som ger lärare och administratörer möjlighet att lägga till och administrera självrättande övningar och uppgifter.
Ingenjörsmetodik IT & ME 2008
Frekvenstabell Frekvenstabell Skriv ett program som slumpar ett tärningskast n gånger. Programmet skall därefter skriva ut en frekvenstabell över observationerna.
En fråga per elev – bråk år 6
KLARA kemikaliehanteringssystem
Formellt, skarpt och snyggt
Frågor om elevinflytande till elever i åk 3 – 9 i grundskolan
DateMe Khoushal, Jonatan, Anders, Therese, Mia. Begränsning och målgrupp 128*160 pixlar 128*160 pixlar Målgruppen är: svensk singel, över 18år, ny mobil,
Utvärdering av workshop - Future Living Vilken grupp tillhörde du? NamnAntal% Byggteknik & Affärsmodeller för framtida bostäder 637,5 Energi och flödeseffektivitet.
Att skriva vetenskapligt
UMEÅ UNIVERSITET Institutionen för beteendevetenskapliga mätningar Val av frågeformat Uppgifter i prov och test Skal-/enkätfrågor.
Att formulera och besvara en idéhistorisk fråga
Presentationens avskrift:

Relationen mellan IR och IE

Upplägg Vad är informationsåtkomst (IR)? Skillnader mellan IR och IE Hur kan IR och IE kombineras? Hur har IR och IE kombinerats? Diskussion

Vad är informationsåtkomst (IR)? nål i en nålstack lista med dokument som (kanske) matchar användarens informationsbehov jämförelse mellan sökfrågan och dokumenten i samlingen

Hur går det till? I huvudsak två processer: indexering  tokenisering  ta bort stoppord  trunkering (ibland lemmatisering) matchning  med avseende på likhetsmått frågan och dokumentet emellan  presenteras oftast i rankad lista

Olika typer av IR-system booleanska system dokument matchas mot frågan som består av olika booleanska kombinationer - ej rankad lista vektor-rymdsystem (vector-space) dokument och fråga representeras av vektorer termviktsmodell se nästa bild...

Termviktning termfrekvens (tf) vikt i proportion till antalet förekomster termen har i dokumentet invers dokumentfrekvens (idf) vikt inverst proportionell till antalet dokument i samlingen som innehåller termen i fråga dokumentets längd (dl) vikt som kompenserar för dokumentens varierande längd

Varför fungerar IR-systemen så pass dåligt?

Systemen förutsätter (generellt sett) att användare vet vad hon/han söker samt kan formulera detta sökbehov att användarens informationsbehov är konstant under hela sökningen att författaren till ett dokument vet vad hon/han vill ha sagt och kan formulera detta exakt att användaren vet vilka termer som används i ett dokument

Skillnader mellan IR och IE

Informationsextraktionssystem i jämförelse med IR-system är svårare, och kräver mer kunskap att bygga upp är mer bundet till domän och scenario kräver mer databehandling ger generellt sett högre precision möjliggör korsspråkliga operationer (CLIR)

Hur kan då IR och IE kombineras?

Tre förslag IE kan efterbehandla utdata från IR två exempel senare IE som komponent, t.ex. i indexering named entity (vårt stödverktyg) IE i samarbete med IR vid sökning och bläddring producera sammanfattningar

Exempel på tillämpningar1 Bear m.fl. (TREC-6) Använde IE som postfilter på IR-utdata Kombinerade SMART (IR) och FASTUS (IE)  SMART producerade lista med 2000 rankade dokument  en något modifierad FASTUS ämnade ranka om listan grammatikor på 23 av 47 ämnen matcha fraser i dokumenten med mönster i FASTUS  resultat: 12 ämnen över medianvärdet (varav 7 ganska bra) 3 samma som medianvärdet 8 under medianvärdet

Exempel på tillämpningar2 Grishman m.fl. (NYU) identifiera relationer och händelser i dok. som nyckelordsbaserade IR-system har svårt att klara gjorde mönster på en av frågorna (nr 9) från TREC-1 ZPRISE rankade de av NIST bedömda dokumenten extraktionsmaskinen rankade om resultat: Antal dokZPRISEZPRISE + em 1080%100% 2070%95% 50061%76%

Diskussion är det intressant att kombinera IR och IE? finns andra tillämpningsområden är de tre nämnda? kan det utvecklas till något användbart? schism mellan de två disciplinerna? vad har jag missat att ta upp?

SLUT Anna Jonsson