Relationen mellan IE och 'text mining' av och med Anette Hulth Läskurs i Informationsextraktion 1999/2000.

Slides:



Advertisements
Liknande presentationer
Digitala portföljer Jonas Gustafsson ILU 15 december 2004
Advertisements

Clean is more than green!. Svenska Cleantechföretag – en dokumentationsidé.
Vatten och Företagsansvar
Att söka och förvalta kunskap
PETER Nicks Product Marketing Manager
Det svenska perspektivet i kölvattnet av SKF-målet Konferens i Nynäshamn 30 mars – 1 april 2011 Jesper Öberg.
Your Name I am Perfect and loved as i am Everybody Fits I Focus on my strenghts I am worth $ _________ a month Focus on your own goal 15 min SeeLiveFeel.
Språkteknologisk forskning och utveckling (HT 2007)
Textkodning: XML ”Having trouble de-coding the text, Albert?”
EU-ambassadörsuppdrag Monza Italien 19 maj 2010 Marie Nygårds & Jeanette Bohman.
Metod i teori & praktik Daniel Nylén. Historik Stradis (1979) SSADM (1981) SSM (1966)RUP (1998) Ethics (1985) Agile (2001)
2007 Microsoft Office System - Klienten Pontus Haglund Mid Market Solutions Specialist Microsoft AB.
 SLIM-forskarskolan – språk och lärande i mångfaldsperspektiv  Ingår i lärarlyftet, en satsning på fortbildning och forskarutbildning för lärare.  Licenciatexamen.
Detection of similarity between documents Axel Bengtsson Ola Olsson
Seminarium Omställningens tid ”Vart vill vi komma? Vad utmärker en hållbar framtid?”
Diskreta, deterministiska system Projekt 1.2; Vildkatt
För att uppdatera sidfotstexten, gå till menyfliken: Infoga | Sidhuvud och sidfot Fondbolagsträff 2015.
H.O.U.S.E 2015 EFFEKTIVISERA DINA PROCESSER MED HJÄLP AV ACTIVE DIRECTORY! Thorir Eggertsson – Inuit AB Johan Lidman – Inuit AB.
Statsvetenskap 3, Statsvetenskapliga metoder
Exempelbaserade specifikationer med SpecFlow
Maskininlärning för informationsextraktion Fredrik Olsson, 5 maj 2000.
Skriftlig individuell uppgift Interaktionsdesign i digitala medier (A.1) HT-2012, 7,5 hp Lärare: Daniel Nylén.
EXtensible Markup Language Digitalisering av kulturarvet
Daniel Nylén, Institutionen för Informatik Organisation 2 C.1 Systemdesign.
Systemdesign som process
Smarter Analytics 22 maj Waterfront. Är det idag möjligt att bygga rapporter med information från textdokument, Sociala medier, FAQ, Kundenkäter osv?
MDI och användbarhet Måndagen den 27/3 Design och utvärdering, 5 poäng.
TUG Konferens Djurönäset 12:e April Patrik Zander, Sr Sales Engineer.
Arkitektrollen. Ansvar och uppgifter Architecture notebook Mycket intensivt elaboration – inception Mål: en stabil arkitektur i slutet på elaboration.
Examensarbete Hur gör man?.
1 L U N D S U N I V E R S I T E T Bygginnovationssystem, VBEN20 Kristian Widén.
Moderaternas Web och Web 2.0 Hanif Bali & Petter Larsson.
Svenska Judoförbundet Stockholms Judoförbund - Klubbmöte 13/11-12 Utbildning.
KICKOFF 27 september 2006 Tillämpningsexpert i vetenskaplig visualisering Ingela Nyström
Dokument Process (DP) Metadata Ett standardiseringssamarbete för att: Att effektivisera åtkomst till verksamhetsdokument mellan och inom organisationer.
Artificiell intelligens och robotar
Don´t just try! Do! Emma Nääs
Lab Contact 1  Lab Assistants:  Meng Liu, Group B  Sara Abbaspour, Group A
Från Webb 2:0 till Webb 3:0. WEBB 0 Webb 0 = ingen webb alls. Data kommunicerades med tal, skrift, tryckkonst samt analoga medier och så småningom elektroniska.
Vision Vi skall vara en ledande europeisk institution för ekonomisk forskning samt samhällsekonomisk analys och för akademisk utbildning inom den areella.
FOCUS fas II info Who´s in FOCUS? Institute and Academia FOI Linköping University Chalmers University of Technology FOCUS is sponsored by the.
Digitization and Management Consulting
Law abiding grounds of filing a divorce Jagianilaw.com.
Types of Business Consulting Services Cornerstoneorg.com.
Annika Winsth April 2017.
NuFACT2017 at Uppsala University
Strategic Sustainable Development
You Must Take Marriage Advice to Stop Divorce! Dontgetdivorced.com.
PhD Manufacturing Technology
DM-Q-48 Template eQuality - Defect found at parts from supplier
Vad betyder Social Kompetens
Sök, sök, sök… Läget, läget, läget… mars 2018/Ted Durdel 1
The “MiGreat Project”- n
Sök, sök, sök… Läget, läget, läget… mars 2018/Ted Durdel 1
Publish your presentations online we present SLIDEPLAYER.SI.
Publish your presentations online we present SLIDEPLAYER.RS.
Publish your presentations online we present SLIDEPLAYER.IN.
Publish your presentations online we present SLIDEPLAYER.VN.
Publish your presentations online we present SLIDEPLAYER.RO.
Publish your presentations online we present SLIDEPLAYER.EE.
Publish your presentations online we present SLIDEPLAYER.CO.IL.
Publish your presentations online we present SLIDEPLAYER.AE.
Publish your presentations online we present SLIDEPLAYER.BG.
Publish your presentations online we present SLIDEPLAYER.AFRICA.
Publish your presentations online we present SLIDEPLAYER.MX.
Publish your presentations online we present SLIDEPLAYER.LT.
Publish your presentations online we present SLIDEPLAYER.LV.
Publish your presentations online we present SLIDEPLAYER.SK.
Presentationens avskrift:

Relationen mellan IE och 'text mining' av och med Anette Hulth Läskurs i Informationsextraktion 1999/2000

Dagens prat w Vad är informationsextraktion? w Vad är text mining? Olika definitioner: Marti Hearst Yves Kodratoff Ronen Feldman Mark Dixon w Vilken relation har IE och TM?

Vad är informationsextraktion? w Att fylla i fördefinierade mallar w Förutsätter att vi vet vad det är vi vill hitta

Vad är text mining? (I) w Fem huvudsakliga källor: Mark Dixon. An Overview of Document Mining Technology ( hinktank/1997/mark/writings/main.html) Ronen Feldman. (Ed.) Text Mining: Foundations, Techniques and Applications. Workshop at IJCAI’99.

w Forts. källor Ronen Feldman. Practical Text Mining. Tutorial at EACL’99. Marti Hearst. Untangling Text Data Mining. ACL’99. Yves Kodratoff. An Application to Knowledge Discovery in Texts. Lecture at ACAI’99.

Vad är text mining? (II) w Saknas definition som alla är överens om w Alla verkar dock överens om att andra definierar området på ett felaktigt eller bristfälligt sätt!

Vad säger Marti? (I) w De flesta (andra) anser att TM är data mining gjord på texter w Men, DM är att hitta mönster snarare än kunskap w Vill ”bokstavligtolka” mining-metaforen w Hitta kunskap som ingen tidigare kände till.

Vad säger Marti (II) ”Lånad” av M. Hearst Text Mining Tools: Instruments for Scientific Discovery, IMA Text Mining Workshop, April 17, 2000

Vad säger Marti? (III) w Känner till två (2) projekt som gör ”riktig” data mining Feldman & Dagan DARPA Topic Detection and Tracking Initiative w Swanson och migrän + magnesium

Vad säger Marti om IE? w Objection: Isn’t this just information extraction? w Response: IE is a useful tool that can be used in this endeavor, however It is currently used to instantiate pre-specified templates I am advocating coming up with entirely new, unforeseen “templates” ”Lånad” av M. Hearst Text Mining Tools: Instruments for Scientific Discovery, IMA Text Mining Workshop, April 17, 2000

Vad säger Yves? (I) w KDT = Knowledge Discovery in Texts w Knowledge ”The knowledge extracted has to be grounded in the real world and will modify the behaviour of a human or mechanical agent” w Discovery --> induktion används w Understandable and directly usable w TextS

Vad säger Yves? (II) w Ett exempel på KDT Le Monde använder inte instanser av begreppet katastrof (t.ex. översvämning eller olycka) om man talar om: Nordamerika Familjer Kvinnor Ekonomi Däremot c:a 300 andra koncept

Vad säger Yves om IE? w IE är ett ”problem” som NLP-samfundet sysslar med w Det syftar till att ”fylla fördefinierade mönster från texter” w Är inte lätt w Kan utgöra del av ett generellt KDT-system

Vad säger Ronen? (I) w Tekniker från: data mining machine learning information retrieval natural-language understanding case-based reasoning statistics knowledge management

Vad säger Ronen? (II) w Förbehandling (textkategorisering el. termextraktion) w Lagring och indexering w Analys (mängd olika tekniker) w Visualisering

Vad säger Ronen om IE? w Inte mycket... w Dock, ett föreslaget tema till verkstaden (men inga sådana bidrag)

Vad säger Mark? w Document mining letar efter mönster och tidigare okänd kunskap i ostrukturerade texter Hur många terroristattacker under 1995? Gör ett företag en bättre förtjänst genom att byta chef ofta? w Kombinerar tekniker från: IE; IR; NLP; och textsammanfattning

Vad säger Mark om IE? w Stegvis process: IR - hitta det dokument som är relevanta för uppgiften IE - extrahera information från dessa (mha templater) Mining - hitta mönster i dessa Tolka - tolka det funna mönstren

Vad hände på verkstaden (IJCAI’99)? w 22 artiklar eller korta artiklar w Svårt att se någon TM i flertalet w IE nämns i ett par som ett delsteg i processen w Gaizauskas ”ren” IE

Vad säger vi om text mining? w På vilket sätt skiljer sig definitionerna åt? w Har någon mer ”rätt” än någon annan?

Vad säger vi om IE? w Är IE + text mining = SANT?? w Hur förhåller sig ijängklijen IE till text mining? w Är det en komponent? Om ja, är den nödvändig?