732G81 Statistik Patrik.Waldmann@liu.se Föreläsning 3 732G81 Statistik Patrik.Waldmann@liu.se
Dagens föreläsning Population vs. Stickprov Läges och spridningsmått Kombinatorik Permutationer och kombinationer Sannolikhetslära Oberoende och disjunkta händelser Bayes sats Satsen om total sannolikhet 732G81
Population Den (oftast teoretiska) mängd enheter som vi vill dra slutsatser om. Kan anses vara ändlig eller oändlig. Ex: 50-åriga tallar i Sverige (variabel höjd) HIV-smittade i världen (variabel dödlighet) Ekonomistudenter vid LiU (variabel studiemotivation) 732G81
Stickprov Den fysiska mängd observationer som vi har data från. Bör vara ett slumpmässigt och representativt urval från den större bakomliggande populationen. Ex: Talldungen på Campus? HIV-smittade på gayklubbar i Stockholm? Ekonomistudenter på denna föreläsning? 732G81
Lägesmått och spridningsmått Illustrerat med programmet R #Generera 1000 dataobservationer från en normalfördelning med #medelvärde 40 och standardavvikelse 2. data1 <- rnorm(1000,40,2) #Generera 1000 dataobservationer från en normalfördelning med #medelvärde 50 och standardavvikelse 10. data2 <- rnorm(1000,50,10) 732G81
Lägesmått och spridningsmått Illustrerat med programmet R #Plotta ett histogram var för data 1 och data 2 #(med 25 staplar). hist(data1,25,xlim=c(1,100)) hist(data2,25,xlim=c(1,100)) 732G81
Lägesmått och spridningsmått Illustrerat med programmet R #Checka att medel och standardavvikelse stämmer mean(data1) 40.02254 sd(data1) 1.972034 mean(data2) 50.2357 sd(data2) 10.20776 732G81
Kombinatorik Permutationer Permutationer när alla element är olika: Visa att mängden S = {1,2,3,4} har 24 möjliga permutationer: (1,2,3,4), (1,2,4,3), (1,4,2,3), … , och (4,3,2,1) 𝑃 𝑛 𝑘 = 𝑛! 𝑛−𝑘 ! = 4! 4−4 ! = 24 1 =24 732G81
Kombinatorik Permutationer Permutationer när alla element är olika: På hur många sätt kan två värden väljas ut ur S = {1,2,3,4}: (1,2), (1,3), (1,4), (2,1), (3,1), (4,1), … , och (4,3) 𝑃 𝑛 𝑘 = 𝑛! 𝑛−𝑘 ! = 4! 4−2 ! = 24 2 =12 Olika ordning 732G81
Kombinatorik Permutationer Permutationer när vissa element är lika: Hur många åttasiffriga nummer kan bildas av S = {1,2,3,4,1,2,3,4} (varje siffra ska ingå två gånger) : 𝑃 𝑛 𝑘 1 , 𝑘 2 , = 𝑛! 𝑘 1 ! 𝑘 2 ! 𝑘 3 ! 𝑘 4 ! = 8! 2!2!2!2! = 40320 16 =2520 732G81
Kombinatorik Kombinationer Kombinationer utan upprepning: Visa att mängden S = {1,2,3,4} bara kan kombineras en gång utan upprepning: (1,2,3,4) anses vara samma som (1,2,4,3), … , och (4,3,2,1) 𝑃 𝑛 𝑘 = 𝑛! 𝑘! 𝑛−𝑘 ! = 4! 4! 4−4 ! = 24 24 =1 732G81
Kombinatorik Kombinationer Kombinationer utan upprepning: Vilka par kan väljas ut ur S = {1,2,3,4}: (1,2), (1,3), (1,4), (2,1), (3,1), (4,1), … , och (4,3) 𝑃 𝑛 𝑘 = 𝑛! 𝑘! 𝑛−𝑘 ! = 4! 2! 4−2 ! = 24 4 =6 Anses vara samma 732G81
Kombinatorik Kombinationer Kombinationer med upprepad dragning: Vilka par kan väljas ut ur S = {1,2,3,4}, givet att varje siffra kan bilda ett par med sig själv: (1,1), (1,2), (1,3), (1,4), … , och (4,4) 𝑃 𝑛 𝑘 = 𝑛+𝑘−1 ! 𝑘! 𝑛−1 ! = 4+2−1 ! 2! 4−1 ! = 120 12 =10 732G81
Sannolikhetslära Definitioner Utfallsrummet för könet på ett barn är S = {F,P} Sannolikheten för att få ett barn med ett visst kön är P(F) = P(P) = ½ Utfallsrummet för könet på två barn är S = {(F,F),(F,P),(P,F),(P,P)} Sannolikheten för var och en av dessa utfall är P((X,Y)) = ¼ 732G81
Sannolikhetslära Händelser och union Könet på två barn i samma familj är oberoende (F hänt så kan P hända) händelser och kan därför inte vara disjunkta (F hänt så kan inte P hända) Definiera två nya händelser E = {(F,F),(F,P)} dvs första barnet av två är en flicka F = {(F,F),(P,F)} dvs andra barnet av två är en flicka Unionen mellan E och F E∪F dvs händelsen att antingen det första eller det andra barnet är en flicka 𝑃 E∪F =𝑃 E +𝑃 F −𝑃 E∩F =0.5+0.5−𝑃 F,F = ¾ Snittet mellan E och F 732G81
Sannolikhetslära Betingade sannolikheter Vad är sannolikheten för två flickor 𝑃 F,F =𝑃 F ∙𝑃 F =0.5 ∙0.5=0.25 En familj har två barn. Vad är den betingade sannolikheten att båda barnen är flickor givet att minst en av dem är det Låt I=𝑃 F,F och J=minst en är flicka 𝑃 𝐼 𝐽 = 𝑃 𝐼∩𝐽 𝑃 𝐽 = 𝑃 F,F 𝑃{ F,F , F,P , P,F } = 0.25 0.75 = 1 3 732G81
Sannolikhetslära Bayes sats Ett test på ett laboratorium har 95% effektivitet i att detektera en sjukdom när sjukdomen verkligen existerar. Testet resulterar dock också i 1% felaktiga positiva resultat när friska personer testas. Om 0.5% av befolkningen verkligen har sjukdomen, vad är sannolikheten att en individ har sjukdomen givet att testet är postivt? 732G81
Sannolikhetslära Bayes sats Låt 𝐷 beteckna händelsen att en person har sjukdomen och 𝐸 händelsen att testet är positivt. Den eftersökta sannolikheten är 𝑃 𝐷 𝐸 och erhålls mha Bayes sats 𝑃 𝐷 𝐸 = 𝑃 𝐷∩𝐸 𝑃 𝐸 = 𝑃 𝐸 𝐷 𝑃 𝐷 𝑃 𝐸 𝐷 𝑃 𝐷 +𝑃 𝐸 𝐷 𝑐 𝑃 𝐷 𝐶 = 0.95 0.005 0.95 0.005 + 0.01 0.995 = 95 294 ≈0.323 Bara 32 procent av de som fått positivt testresultat har sjukdomen. 732G81
Tips om ytterligare information Hemsida med exempel på permutationer (eng. permutations) och kombinationer (eng. combinations) http://www.artofproblemsolving.com/Wiki/index.php/Combinat orics/Introduction Skillnaden på disjunkta (eng. disjoint) och oberoende (eng. independent) händelser beskrivs i följande video: http://www.youtube.com/watch?v=hqgZF3H0lxM Bra exempel på Bayes sats (eng. Bayes theorem) finns bl a på: http://www.kevinboone.net/bayes.html 732G81