ILP – Bild 1 Induktiv logikprogrammering Regler Sökstrategier Flerklassproblem Överanpassning Ensembler Henrik Boström.

Slides:



Advertisements
Liknande presentationer
F. Drewes, Inst. f. datavetenskap1 Föreläsning 13: Resolution •Resolution i satslogiken •Resolution i predikatlogiken.
Advertisements

Köp från eget bolag Upphandlingsstödsdagen 8 november 2013.
Från mönster till algebra
Relationsdatabasdesign
© Anders Broberg, Ulrika Hägglund, Lena Kallin Westin, 2003 Datastrukturer och algoritmer Föreläsning
Vilmaseminarium November 2012
1 Tillämpning av Koden Innehåll •Undersökningens metod och uppläggning, inkl. bolagsurval •Sammanfattning •Genomgång av svar på fokusfrågor.
1 Logikprogrammering ons 11/9 David Hjelm. 2 Repetition Listor är sammansatta termer. De består av en ordnad mängd element. Elementen i en lista kan vara.
Prolog, Mån 16/9 Rebecca Jonson.
Logikprogrammering, Mån 23/9 Rebecca Jonson. Repetition P :- Q, R. Deklarativ syn: –P är sann om Q och R är sanna. –Av Q och R följer P Procedurell syn:
Sökning och sortering Linda Mannila
Nya typer Konstruerare, selektorer och predikat Rekursiva datatyper
Haskell Lite mera om listor. Skapa en lista mha ett delintervall Prelude> [1..8] [1,2,3,4,5,6,7,8] Prelude> [ ] [1.1,2.1] Prelude> [ ]
Klassarv och inkapsling
Logikprogrammering Ons, 25/9
Stora + Störst tal först. Stora additionstabellen Tanketips!
© Anders Broberg, Ulrika Hägglund, Lena Kallin Westin, 2003 Datastrukturer och algoritmer Föreläsning 4.
Datastrukturer och algoritmer Föreläsning 11. Datastrukturer och algoritmer VT08 Innehåll  Mängd  Lexikon  Heap  Kapitel , , 14.4.
Predicting protein folding pathways.  Mohammed J. Zaki, Vinay Nadimpally, Deb Bardhan and Chris Bystroff  Artikel i Bioinformatics 2004.
Elkraft 7.5 hp distans: Kap. 3 Likströmsmotorn 3:1
För utveckling av verksamhet, produkter och livskvalitet. Algoritmer och datastructurer - Lite mer rekursivitet -Sorterrings algoritmer -- Kapitel 8 Algoritmer.
1 Sårbarhetsanalys av vägtransportnätverk Erik Jenelius Avd. för transport- och lokaliseringsanalys, KTH VTI Transportforum, Linköping, januari 2007.
2D1311 Programmeringsteknik med PBL Föreläsning 6 Skolan för Datavetenskap och kommunikation.
1 Föreläsning 3 Datalogi för E1 / 2D1343 Repetition List List operationer Stränghantering For-slingor.
Föreläsning 4 Python: Definiering av egna funktioner Parametrar
FL2 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
Stora additionstabellen
Bastugatan 2. Box S Stockholm. Blad 1 Läsarundersökning Maskinentreprenören 2004.
© Anders Broberg, Ulrika Hägglund, Lena Kallin Westin, 2004 Datastrukturer och algoritmer Föreläsning 3.
SWEDISH AGENCY FOR ECONOMIC AND REGIONAL GROWTH 1 Entreprenörskaps- barometern 2012 Entreprenörskapsbarometern 2012 Sveriges största attitydundersökning.
Att få rätt saker att hända
Barns tillgång till svenskt teckenspråk
Byggnadsmekanik gk 2.1 SNITTKRAFTER
Elevrelationer – sociala interaktioner mellan individer i en skolkontext Kontextuell nivå: Interpersonell nivå: Individnivå:
Bild 1 Hur använder vi KursInfo idag? Högskolan i Skövde.
Bedömning Strategi 2 Tillfälle 4 1 Att ta fram belägg för elevers prestationer Att åstadkomma effektiva klassrumsdiskussioner, aktiviteter och.
Listor En lista är en föränderlig ordnad samling objekt.
Känna till och ha provat metoder och verktyg för processledning
Stöd till en evidensbaserad praktik för god kvalitet inom socialtjänsten – brukarmedverkan vid brukarundersökningar inom LSS • • SKAPAD.
Vänsterpartiet Retorik Vänsterskolan.
Diskreta, deterministiska system Projekt 1.2; Vildkatt
1 Föreläsning 6 Programmeringsteknik och Matlab 2D1312/2D1305 Metoder & parametrar Array API och klassen ArrayList.
Styrteknik 7.5 hp distans: SFC Introduktion SFC_A:1
1 Logging and monitoring of TCP traffic in SSH tunnels Masters thesis Anton Persson.
INTRODUKTION Balken kan ha olika tvärsnitt
Statistik för internationella civilekonomer
Nackaungdomars fritid - en undersökning Tidpunkt Skolår 7, 9, Gy år 2 okt 2004 Skolår 4 okt 2005 Metod för insamling.
Praktisk epidemiologi för allmänläkare
1 L U N D S U N I V E R S I T E T Resultat av internundersökning om information på LTH Genomförd våren 2007.
Att relatera till tidigare vetenskapliga arbeten
F4 - Funktioner & parametrar 1 Programmeringsteknik, 4p vt-00 Modularisering ”svarta lådor” Väl definierade arbetsuppgifter Enklare validering Enklare.
Stora subtraktionstabellen
Vägda medeltal och standardvägning Index
1 ITK:P2 F6 Sortering av generiska containerklasser DSV Peter Mozelius.
Räkna till en miljard 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13,14,15,16,17,18,19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, En miljard är ett.
Föreläsning 4 Listor, tupler, och for-loopar. Listor En lista är en föränderlig ordnad samling objekt. Listor skapas med hakparenteser. lista = [12,13,14,15]
ITK:P1 Föreläsning 2 Introduktion till objektorientering DSV Marie Olsson.
Hur bra är modellen som vi har anpassat?
1 L U N D S U N I V E R S I T E T Bygginnovationssystem, VBEN20 Kristian Widén.
Kan två räta linjer ge upphov till kaos? Matematikbiennalen 2010 Hans Thunberg, KTH Torsten Lindström, Linnéuniversitetet.
Lunds universitet / Samordnat IT-stöd vid LU / Mars 2010 NETinfo-möte Samordnat IT-stöd Lunds universitet Johnny Nilsson, PL Birgitta Lastow,
1 Mönstermatchning och rekursion Nr 4. 2 Förenklad notation val fnname = fn name => expression Förenklas till fun fnname name = expression Exempel fun.
1 Mjukvaru-utveckling av interaktiva system God utveckling av interaktiva system kräver abstrakt funktionell beskrivning noggrann utvecklingsmetod Slutanvändare.
Huvudsatser och bisatser
Föreläsning 13 Logik med tillämpningar Innehåll u Aritmetik i Prolog u Rekursiva och iterativa program u Typpredikat u Metalogiska predikat.
Karl-Henrik Hagdahl, 11 november Repetition Logikprogrammering: måndag 11 november 2002.
Logik med tillämpningar
F. Drewes, Inst. f. datavetenskap1 Föreläsning 5: Syntaxanalys (parsning) Syntaxanalysens mål Tillvägagångssätt och komplexitet Syntaxanalys.
Dipol eller ej-verktyget Här är en metod för att ta reda på om en molekyl är en dipol eller om molekylen inte är en dipol. Vi använder verktyget på vattenmolekylen.
Presentationens avskrift:

ILP – Bild 1 Induktiv logikprogrammering Regler Sökstrategier Flerklassproblem Överanpassning Ensembler Henrik Boström

ILP – Bild 2 Regler illegal(WKr,WKc,BKr,BKc,BRr,BRc) :- WKr = BRr, WKc  BRc, WKr  BKr. sentence(L1,L2) :- determiner(L1,L3), noun(L3,L4), verb(L4,L2) ? ? ? active(M) :- atom(M,A1,E,C1), atom(M,A2,E,C2), C1 > C2.

ILP – Bild 3 Några tillämpningar Molekylärbiologi (läkemedelsaktivitet, mutagenicitet, sekundär- strukturer hos protein) active(M):- atom(M,A1,E1,T1,C1), atom(M,A2,E2,T2,C2),... Naturligt språkbehandling (morfologi, part-of-speech tagging, grammatik) rmv(A,B,dt):- nounp(B,C),noun(C,D), pos(D,E), nounp(E,F). Diagnos-, styr- och modelleringssystem (diagnos av fel i kommunikationssatteliter, manövrera F-16 simulator, kvalitativa modeller)

ILP – Bild 4 Induktionsproblemet Givet: en mängd bakgrundspredikat B och två disjunkta mängder grunda atomer P och N Finn: en hypotes (regelmängd) H, så att H  B  p, för alla p  P och H  B |  n, för alla n  N

ILP – Bild 5 Exempel B = suit(Suit):- black(Suit). suit(Suit):- red(Suit). rank(Rank):- num(Rank). rank(Rank):- face(Rank). black(spades). black(clubs). red(hearts). red(diamonds). num(1).... num(10). face(jack). face(queen). face(king). P = {reward(spades,7), reward(clubs,3)} N = {reward(hearts,5), reward(clubs,jack)}

ILP – Bild 6 Top-Down vs. Bottom-Up Induction Top-Down (General-to-specific) induction Starta med en hypotes som täcker några positiva exempel och specialisera den tills inga negativa exempel täcks. Bottom-Up (Specific-to-general) induction Starta med en hypotes som täcker endast positiva exempel och generalisera den så långt det går utan att negativa exempel täcks.

ILP – Bild 7 Separate-and-Conquer Indata: E + (positiva exempel), E – (negativa exempel) och T (målpredikat) Utdata: H (hypotes) H :=  och Pos := E + Så länge Pos   C := T Så länge C täcker något negativt exempel Specialisera C Addera C till H Subtrahera de element i Pos som täcks av H Returnera H System: Foil, Progol

ILP – Bild 8 Divide-and-Conquer Indata: E + (positiva exempel), E – (negativa exempel) och T (målpredikat) Utdata: H (hypotes) H := T Så länge någon klausul C i H täcker ett negativt exempel Om C täcker något positivt exempel så ersätt C med split(C) annars subtrahera C från H Returnera H System: CART, C4.5, Spectre, Tilde

ILP – Bild 9 Heuristik för val av specialisering Divide-and-Conquer Separate-and-Conquer

ILP – Bild 10 Kung-Torn vs. Kung-Bonde

ILP – Bild 11 Grammatik

ILP – Bild 12 Tic-Tac-Toe

ILP – Bild 13 Replikationsproblemet p(X1,X2,X3,X4):- X1=1, X2=1. p(X1,X2,X3,X4):- X3=1, X4=1. p(X1,X2,X3,X4):- X3=1, X4=2. p(X1,X2,X3,X4):- X3=1, X4=1. p(X1,X2,X3,X4):- X3=1, X4=2. p(X1,X2,X3,X4):- X3=1, X4=3, X1=1, X2=1. p(X1,X2,X3,X4):- X3=1, X4=4, X1=1, X2=1. p(X1,X2,X3,X4):- X3=2, X1=1, X2=1. p(X1,X2,X3,X4):- X3=3, X1=1, X2=1. p(X1,X2,X3,X4):- X3=4, X1=1, X2=1. SAC DAC

ILP – Bild – – – – – – – – – – – – – – – – Divide-and-Conquer är effektivare än Separate-and- Conquer (O(|E|) vs. O(|E| 2 ) ). Hypotesrymden är större för Separate-and-Conquer än för Divide-and-Conquer. För varje hypotes i hypotesrymden för Separate-and- Conquer så finns det en ekvivalent hypotes i hypotesrymden för Divide-and-Conquer. Divide-and-Conquer är i motsats till Separate-and- Conquer ej applicerbar för inlärning av rekursiva regler. Separate-and-Conquer vs. Divide-and-Conquer

ILP – Bild 15 Flerklassproblem Inga problem för Divide-and-Conquer: - endast heuristiken behöver modifieras - reglerna är ej överlappande, så ordningen spelar ingen roll Två möjligheter för Separate-and-Conquer: i) betrakta reglerna som ordnade (decision lists)  strategi för att bestämma i vilken ordning reglerna skall läras behövs ii) betrakta reglerna som oordnade  strategi för att resolvera konflikter behövs System: CN2

ILP – Bild 16 Överanpassning Sannolikhetsmått Pre- och Post-Pruning Incremental Reduced Error Pruning

ILP – Bild 17 Sannolikhetsmått Relativ frekvens Laplace mått m-estimate

ILP – Bild 18 Pre- och Post-pruning Pre-pruning - specialisering av regel som täcker exempel från flera klasser utförs inte om ej tillräckligt bra alternativ finns (t.ex. ingen informations- vinst) - effektiv men riskfylld metod Post-pruning - reglerna generaliseras efter att en konsistent hypotes har genererats - mer kostsam men ger ofta upphov till mer korrekt hypotes

ILP – Bild 19 Incremental Reduced Error Pruning Applicera Post-pruning direkt på en regel efter att den lagts till hypotesen av SAC Stor effektivitetsvinst då ju en större mängd exempel kan subtraheras vid varje iteration Dock risk för s.k. ”hasty generalisation” System: IREP, Ripper, Flipper

ILP – Bild 20 Ensembler av klassificerare Randomisation Bagging Boosting En uppsättning klassificerare får rösta (ev. med olika vikter) när ett nytt exempel skall klassificeras. De mest populära metoderna för att genera en ensemble är: