FST - Torbjörn Lager, UU 1 Datalingvistiska tillämpningar zMaskinöversättning zDialogsystem (ev. talad dialog, ev. multimodal) zTextförståelsesystem zInformationsextraktion.

Slides:



Advertisements
Liknande presentationer
Digitala portföljer Jonas Gustafsson ILU 15 december 2004
Advertisements

Vi bläddrar i minnenas arkiv eller Va’ va de vi sa Om framtiden !
- Hur vet vi om vi har lyckats?
Grammatikkontroll för skribenter med svenska som andraspråk
Språkteknologisk forskning och utveckling (HT 2007)
Stora + Störst tal först. Stora additionstabellen Tanketips!
Utbildningsdag i språkteknologi Mats Wirén TeliaSonera, Haninge Forskning och affärsutveckling.
Stora additionstabellen
Windows server 2012 och DNS/DNSSEC
 SLIM-forskarskolan – språk och lärande i mångfaldsperspektiv  Ingår i lärarlyftet, en satsning på fortbildning och forskarutbildning för lärare.  Licenciatexamen.
Peace Through Service is RI theme Sakuji Tanaka RI President In Rotary, our business is not profit. Our business is peace. Our reward is not money,
Workshop 4 Framgångsrika Föredömen Lean Forum Konferens 8 oktober 2009 Anette Kinde.
INDIVIDORGANISATION.  FÖRHÅLLNINGSSÄTT: HUR VI FÖRHÅLLER OSS TILL VARANDRA  ”ATT FÖRUTSÄTTA” ÄR NYCKELN TILL FÖRHÅLLNINGSSÄTTET  VI KONSTRUERAR POSITIVA.
Med brukarna i centrum eller vilken roll kan Daisy/Epub spela när det gäller universell utformning? - om Begripsam UD2014 The web and cognitive disabilities.
Språkteknologiska metoder Språkteknologisk forskning och utveckling (HT 2006)
Presens och imperfekt av have. Translate! Jag har huvudvärk. Hon har en röd Volvo. De har två barn tillsammans.
Bild 1 Hur använder vi KursInfo idag? Högskolan i Skövde.
VÄLKOMMEN TILL SKOLKOLLEGIET.SE Almedalen 2014 Seminarium 1/7 Livslångt lärande… SKOLKO LL EGIET.
Hastighetsefter- levnad – hur tar vi nästa steg? Nuläge kring stödsystem för hastighets– anpassning Sista sekunden Anders Lie, Trafikverket.
Lärandemål Program Dialogerna 1& Presentation av dialog Lunch dialog dialog.
Experimentell utvärdering Språkteknologisk forskning och utveckling (HT 2006)
För att uppdatera sidfotstexten, gå till menyfliken: Infoga | Sidhuvud och sidfot Fondbolagsträff 2015.
I’m lost I’m lost now asks for help excuse me Don’t worry!
Prevention i befolkning Diagnos Recidiv/generalisering Avlida i cancer Försämring Frisk Leva med cancer Symtom hos individ Frisk.
Exempelbaserade specifikationer med SpecFlow
Styrning av produktegenskaper via kryobearbetning och optimering av materials skärbarhet  Kryobearbetning med flytande CO2 eller flytande N2 innebär att.
En utvecklingsmodell för (ingenjörs)utbildning Roger Renström.
18-21 augusti 2004 Sociala media för statistik Hur kan nationella statistikbyråer utnyttja sociala medier för intern och extern kommunikation? Omvärldsbevakning.
Page 1, 27 March 2007, © Automation Region Automationsnätverket i Mälardalen Nätverksmöte
Olof Lundström, M Sc Thesis. Bakgrund Forskningskommersialisering är komplext Bayh-Dole Act & Lärarundantaget OTL – Office of Technology Licensing.
Strategisk ekonomistyrning: Föreläsning Professor Fredrik Nilsson Linköping
Välkomna till Göteborg 13e Mars Dagens program 10:00-12:00 Genomgång av nationella resultat 2014 Diskussion Induktioner inledning 12: :00.
Forskning om dialog och dialogsystem på inst. för lingvistik målsättning: –utveckla teorier om mänsklig dialog som kan användas i byggandet av dialogsystem.
Public Participation and Dialogue in Road-Planning and Road-Design Example: Bypass Norrtälje Suzanne de Laval SWEDEN.
Stora subtraktionstabellen
Mathematics 1 /Matematik 1 Lesson 7 – complex numbers Lektion 7 – Komplexa tal.
Formella metoder i MDI Behovet Vad menas med formell? Verktyg Exempel Att läsa: Kapitel 14 i Carroll.
En samling vokaler och konsonanter
1 L U N D S U N I V E R S I T E T Bygginnovationssystem, VBEN20 Kristian Widén.
STOCKHOLMS UNIVERSITETSBIBLIOTEK Te l e f o n v x l: F ax: w w w.s u b.s u.se Informationssökning för geodoktorander Geobiblioteket,
1 Mönstermatchning och rekursion Nr 4. 2 Förenklad notation val fnname = fn name => expression Förenklas till fun fnname name = expression Exempel fun.
Hur är vi?? Hur gör vi?? Varför gör vi?? 1. Församlingen Var samlas man? Vad gör man där? Varför gör man som man gör där? Vilka gör vad?
KI - 1 Introductory computer programming, 5p (7.5 ECTS credits) VT-03 Teacher and assistents Responsible for the course: Per Lindström
 Who frågar efter en persons (eller personers) identitet (vem dem är).  Who is he?  Who are they?  Who is coming?
“Be” (vara) i presens 1. I 2. You 3. He, she, it 1. We 2. You 3. They.
Formella metoder i MDI Behovet Vad menas med formell? Verktyg Exempel Att läsa: Kapitel 14 i kursboken.
1-1 Copyright © 2009 Pearson Education, Inc. Publishing as Pearson Addison-Wesley 1-1 Programmering 7.5 hp Programmering är... creativ, fascinerande, roligt,
Varmt välkomna till Timrå gymnasiums Volontär mässa 5 februari en del i Well being projektet.
Demokrati Representativ demokrati – rösträtt, val som höjdpunkt. Deliberativ demokrati – kommunikativa processer, kollektiv beslutfattning.
studenter 575 medarbetare Högskolan Väst 2.
Skakiga underlag Kvantitativa enkätundersökningar är mycket bra men bara om de används rätt Norstat 2015.
Vision Vi skall vara en ledande europeisk institution för ekonomisk forskning samt samhällsekonomisk analys och för akademisk utbildning inom den areella.
UNESCOS MÅL FÖR HÅLLBAR UTVECKLING & UTBILDNING 2030 Kristiina Volmari, Utbildningsstyrelsen 18 januari 2016.
Skolledardagen Platsen var Birger Jarl i Stockholm Jag var där och Eva-Lis Sirén Men även Ann-Marie Begler, GD Skolinspektionen Hennes råd till.
Digitization and Management Consulting
Types of Business Consulting Services Cornerstoneorg.com.
Trinity College Hanna Tell och Christina Åhlenius
Effektivt och Ansvarsfullt Strategiarbete
Träna svenska A och B Häfte 1 Alfabetet.
Lycka till med din dator! Fler guider på Good Luck!
Formal Languages, Automata and Models of Computation
Viveka Palm Deputy Director Regions and Environment, Statistics Sweden
An Exercise in Awareness...
Lärare som forskar Samarbete mellan Malmö stad och Malmö högskola
Mindset.
Viewpoint The Viewpoint Organisation was established in 1999 to promote the engagement and participation of children and young people in decisions that.
MaskinInlärning NyAs Dokument
Changes version bakisakuten.se.
Titel på projektet Title of the project
IKEAs produktsäkerhetsarbete
Presentationens avskrift:

FST - Torbjörn Lager, UU 1 Datalingvistiska tillämpningar zMaskinöversättning zDialogsystem (ev. talad dialog, ev. multimodal) zTextförståelsesystem zInformationsextraktion zInformationssökning zGrammatikkontroll zDatorstödd språkinlärning zetc.

FST - Torbjörn Lager, UU 2 Datalingvistiska ‘komponentteknologier’ zAnalys och generering av tal zOrdklasstaggning zMorfologisk analys och generering zSyntaktisk analys (parsning) zSemantisk tolkning zReferenslösning zPlanering och planigenkänning zKunskapsrepresentation och inferens zetc.

FST - Torbjörn Lager, UU 3 Ordklasstaggning: Exempel 1 zHe can can a can zHe/pron can/aux can/vb a/det can/n zHe/{pron} can/{aux,n} can/{vb} a/{det} can/{n,vb}

FST - Torbjörn Lager, UU 4 Ordklasstaggning: Exempel 2 zI can light a fire and you can open a can of beans. Now the can is open and we can eat in the light of the fire. zI/PRP can/__ light/__ a/DT fire/NN and/CC you/PRP can/__ open/__ a/DT can/__ of/IN beans/NNS./. Now/RB the/DT can/__ is/VBZ open/__ and/CC we/PRP can/__ eat/VB in/IN the/DT light/__ of/IN the/DT fire/NN./.

FST - Torbjörn Lager, UU 5 Ordklasstaggning: Exempel 2 zI can light a fire and you can open a can of beans. Now the can is open and we can eat in the light of the fire. zI/PRP can/MD light/VB a/DT fire/NN and/CC you/PRP can/MD open/VB a/DT can/NN of/IN beans/NNS./. Now/RB the/DT can/NN is/VBZ open/JJ and/CC we/PRP can/MD eat/VB in/IN the/DT light/NN of/IN the/DT fire/NN./.

FST - Torbjörn Lager, UU 6 Olika typer av relevant information zlexikal information zkontextuell information

FST - Torbjörn Lager, UU 7 Varför ordklasstagga? zKorpuslingvistisk forskning zEtt försteg till ordbetydelsebestämning zEtt försteg till parsning z?

FST - Torbjörn Lager, UU 8 Part-of-speech tagging Processor Knowledge Text POS tagged text Needed: - some strategy for representing the knowledge - some method for acquiring the knowledge - some method of applying the knowledge

FST - Torbjörn Lager, UU 9 Some POS-tagging issues zAccuracy zSpeed zSpace requirements zRobustness zLearning Processor Knowledge Text POS tagged text

FST - Torbjörn Lager, UU 10 Vanliga indelningar zTaggningmetoder yregelbaserade ystatistiska zInlärningsmetoder y'Supervised learning' y'Unsupervised learning'

FST - Torbjörn Lager, UU 11 Formella verktyg zFormell logik zSannolikhetsteori och statistik zAutomatateori och matematisk lingvistik zAlgoritm- och komplexitetsteori

FST - Torbjörn Lager, UU 12 Taggningsmetoder zHMM-taggning ystatistikbaserad (probabilistisk) y'supervised learning' zBrilltaggning yregelbaserad y'supervised learning' zConstraint-Grammar tagging yregelbaserad yingen inlärning

FST - Torbjörn Lager, UU 13 Hidden Markov Modelling zstatistikbaserad zDen modiga ansatsen: "På basis av en sammanvägning av tillgänglig lexikal och kontextuell information, gissa!

FST - Torbjörn Lager, UU 14

FST - Torbjörn Lager, UU 15 Brilltaggning zStrategi: "Gissa först, men ändra sen om nödvändigt" zEnkelt "heuristiskt" lexikon zEn sekvens av transformationsregler betingade på lokal kontext: zRegelexempel: tag:vb>nn <-

FST - Torbjörn Lager, UU 16 Brilltaggning steg 1 zI can light a fire and you can open a can of beans. Now the can is open and we can eat in the light of the fire. zI/PRP can/MD light/JJ a/DT fire/NN and/CC you/PRP can/MD open/JJ a/DT can/MD of/IN beans/NNS./. Now/RB the/DT can/NN is/VBZ open/JJ and/CC we/PRP can/MD eat/VB in/IN the/DT light/JJ of/IN the/DT fire/NN./.

FST - Torbjörn Lager, UU 17 Transformation-based tagging zRepresentational strategy: ySimple lexica yOrdered lists of transformations, conditioned on (small amounts) of local context zLearning strategy: Transformation- based learning

FST - Torbjörn Lager, UU 18 Transformation-based tagging zThree steps: yLexical look-up yLexical rule application for unknown words yContextual rule application

FST - Torbjörn Lager, UU 19 Transformation-based tagging blue green red brown yellow blue red K. Samuel 1998

FST - Torbjörn Lager, UU 20 Lexikon för Brilltaggning IPRP NowRB aDT andCC beansNNS canMD eatVB fireNN inIN isVBZ lightJJ ofIN openJJ theDT wePRP youPRP.

FST - Torbjörn Lager, UU 21 'Constraint-Grammar'-taggning zRegelbaserad zDen försiktiga ansatsen: "Gissa inte! Eliminera bara det omöjliga!"

FST - Torbjörn Lager, UU 22 Ordklasstaggning: Exempel 2 zI can light a fire and you can open a can of beans. Now the can is open and we can eat in the light of the fire. zI/{PRP} can/{MD,NN} light/{JJ,NN,VB} a/{DT} fire/{NN} and/{CC} you/{PRP} can/{MD,NN} open/{JJ,VB} a/{DT} can/{MD,NN} of/{IN} beans/{NNS}./{.} Now/{RB} the/{DT} can/{MD,NN} is/{VBZ} open/{JJ,VB} and/{CC} we/{PRP} can/{MD,NN} eat/{VB} in/{IN} the/{DT} light/{JJ,NN,VB} of/{IN} the/{DT} fire/{NN}./{.}

FST - Torbjörn Lager, UU 23 Problem zAmbiguitet zOkända ord zOvanliga ord zOvanliga kontexter

FST - Torbjörn Lager, UU 24 Assessing the Brill tagger PARAMETER Accuracy96.5% SpeedVery fast Space req.Moderate RobustnessRobust LearningYes

FST - Torbjörn Lager, UU 25 Ordklasstaggning: Några ansatser zDen modiga ansatsen: "På basis av en sammanvägning av tillgänglig information, gissa! zDen försiktiga ansatsen: "Gissa inte! Eliminera bara det omöjliga!" zDen vankelmodiga ansatsen: "Gissa först, men ändra sen om nödvändigt"

FST - Torbjörn Lager, UU 26 Parsning z'Klassisk' parsning med frasstrukturgrammatik zYtparsning

FST - Torbjörn Lager, UU 27 En enkel frasstrukturgrammatik Fragment lisa springer lisa skjuter en älg Grammatik s --> np, vp. np --> pn. np --> det, n. vp --> v. vp --> v, np. pn --> [kalle]. pn --> [lisa]. det --> [en]. n --> [älg]. v --> [springer]. v --> [skjuter].

FST - Torbjörn Lager, UU 28 Igenkänning och Parsning zIgenkänning ?- s([lisa,springer],[]). yes ?- s([springer,lisa],[]). no zParsning  ?- s(Tree,[lisa,springer],[]). Tree = s(np(pn(lisa)),vp(v(springer)))

FST - Torbjörn Lager, UU 29 Parsning Frasstruktur

FST - Torbjörn Lager, UU 30 Bygga träd i ett argument Grammatik s(s(NP,VP)) --> np(NP),vp(VP). np(np(PN)) --> pn(PN). np(np(DET,N)) --> det(DET),n(N). vp(vp(V)) --> v(V). vp(vp(V,NP)) --> v(V), np(NP). pn(pn(lisa)) --> [lisa]. det(det(en)) --> [en]. n(n(älg)) --> [älg]. v(v(går)) --> [går]. v(v(skjuter)) --> [skjuter].

FST - Torbjörn Lager, UU 31 Bygga träd i ett argument Parsning ?- s(Tree,[lisa,skjuter,en,älg],[]). Tree = s( np( pn(lisa)), vp( v(skjuter), np( det(en), n(älg))))

FST - Torbjörn Lager, UU 32 Parsning med meta- interpretator s --> np, vp.det --> [en]. np --> pn.n --> [älg]. np --> det, n.tv --> [skjuter]. vp --> v, np.pn --> [lisa]. ? - parse(s,[lisa,skjuter,en,älg],[],Tree). Tree = s/(np/pn/lisa,vp/(v/skjuter,np/(det/en,n/älg)))

FST - Torbjörn Lager, UU 33 Parsning med meta- interpretator parse(A,P0,P,A/Trees) :- (A --> B), parse(B,P0,P,Trees). parse((B,Bs),P0,P,(Tree,Trees)) :- parse(B,P0,P1,Tree), parse(Bs,P1,P,Trees). parse([Word],[Word|P],P,Word).

FST - Torbjörn Lager, UU 34 Strukturell ambiguitet zDen gamla damen träffade killen med handväskan zJohn saw a man in the park with a telescope zRåttan åt upp osten och hunden och katten jagade råttan

FST - Torbjörn Lager, UU 35 Lokal ambiguitet zThe old man the boats zThe horse raced past the barn fell

FST - Torbjörn Lager, UU 36 Some parsing issues zAccuracy zSpeed zSpace requirements zRobustness zLearning Processor Knowledge Text Parsed text

FST - Torbjörn Lager, UU 37 Problems with traditional parsers zCorrect lowlevel parses are often rejected because they do not fit into a global parse -> brittleness zAmbiguity -> indeterminism -> search -> slow parsers zAmbiguity -> sometimes hundreds of thousands of parse trees, and what can we do with these?

FST - Torbjörn Lager, UU 38 Another strategy (Abney) zStart with the simplest constructions (’easy-first parsing’) and be as careful as possible when parsing them -> ’islands of certainty’ z ’islands of certainty’ -> do not reject these parses even if they do not fit into a global parse -> robustness zWhen you are almost sure of how to resolve an ambiguity, do it! -> determinism zWhen you are uncertain of how to resolve an ambiguity, don’t even try! -> ’containment of ambiguity’ -> determinism zdeterminism -> no search -> speed

FST - Torbjörn Lager, UU 39 Shallow syntax yanalyses less complete than conventional parser output yidentifies some phrasal constituents (e.g. NPs), without indicating their internal structure and their function in the sentence. yor identifies the functional role of some of the words, such as the main verb, and its direct arguments.

FST - Torbjörn Lager, UU 40 Deterministic bottom-up parsing zAdapted from Karttunen 1996: define NP [(d) a* n+] ; regex “[NP”... “]”.o. v “[NP” NP “[VP”... “]” ; apply down dannvaan [NP dann][VP v [NP aan]] zNote the use of the longest-match operator!

FST - Torbjörn Lager, UU 41