732G81 Statistik Patrik.Waldmann@liu.se Föreläsning 3 732G81 Statistik Patrik.Waldmann@liu.se.

Slides:



Advertisements
Liknande presentationer
Punkt- och intervallskattning Felmarginal
Advertisements

Inferens om en population Sid
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Exempel Utifrån medicinsk erfarenhet är 5% av befolkningen smittade av ett visst virus. Ett nytt test har visat sig ge 80% av de smittade korrekt diagnos.
FL3 732G81 Linköpings universitet.
FL8 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
FL10 732G81 Linköpings universitet.
FL9 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
FL5 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Inferens om en ändlig population Sid
732G70 Statistik A, 7hp Linda Wänström
Jämförelse av två populationer Sid
Kapitel 5 Stickprovsteori Sid
Skånes Universitetssjukhus
732G22 Grunder i statistisk metodik
FL2 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
F11 Olika urvalsmetoder, speciellt obundet slumpmässigt urval (OSU)
Workshop i statistik för medicinska bibliotekarier!
Vad ingår kursen? i korta drag
Sammanfatta siffrorna…
Skattningens medelfel
Experimentell utvärdering Språkteknologisk forskning och utveckling (HT 2006)
732G81 Statistik för internationella civilekonomer
Förelasning 1 Kursintroduktion Statistiska undersökningar
Centrala Gränsvärdessatsen:
FK2002,FK2004 Föreläsning 2.
Föreläsning 81 Sampling och urval Ofta möter vi påståenden av typen “4.5 miljoner svenskar såg VM-finalen i fotboll”, “en svensk tolvåring väger i genomsnitt.
732G22 Grunder i statistisk metodik
FL7 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Binomialsannolikheter ritas i ett stolpdiagram
Statistik för internationella civilekonomer
Föreläsning 4: Sannolikhetslära
Sannolikhet Stickprov Fördelningar
FL6 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Föreläsning 7 Fysikexperiment 5p Poissonfördelningen Poissonfördelningen är en sannolikhetsfördelning för diskreta variabler som är mycket.
732G22 Grunder i statistisk metodik
Normalfördelningen och centrala gränsvärdessatsen
Matematisk statistik och signal-behandling - ESS011 Föreläsning 3 Igor Rychlik 2015 (baserat på föreläsningar av Jesper Rydén)
Grundläggande statistik ht 09, AN
Slumptal Pseudoslumptal Fysikexperiment 5p Föreläsning 2
Mål Matematiska modeller Biologi/Kemi Statistik Datorer
Fysikexperiment, 5p1 Random Walk 36 försök med Random walk med 1000 steg. Beräknad genomsnittlig räckvidd är  1000  32. Visualisering av utfallsrum.
Matematisk statistik och signal-behandling - ESS011 Föreläsning 1 Igor Rychlik 2015 (baserat på föreläsningar av Jesper Rydén)
732G22 Grunder i statistisk metodik
1 Fler uträkningar med normalfördelningstabell Låt X vara Nf(170,5). Beräkna Lösning:
Grundläggande statistik, ht 09, AN
Statistiska samband i trafikolyckor Av: Lina Forsberg Hangjin Lee Daniel Leo Carl-Mikael Westman.
Grundläggande statistik, ht 09, AN1 F6 Slumpmässigt urval 1. Population där X är diskret med fördelningen p(x). Medelvärdet μ och variansen σ². Observationer:
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
Deskription + enkät Mätnivån styr hur man kan analysera data Tabeller – frekvenstabeller Diagram – cirkeldiagram, stapeldiagram, histogram, boxplot Beskrivande.
Vetenskaplig metod Statistik 1. VAD ÄR STATISTIK? 2. DESKRIPTION 3. URVAL 4. STATISTISK INFERENS OCH HYPOTESPRÖVNING a) t-test b) ickeparametriska test.
Introduktion. Exempel: Till ett försök med bantningsmedlet Bantomid anmälde sig 14 personer frivilligt, alla med övervikt. De delades slumpmässigt in.
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Vad är Statistik? Inom statistik teorin studeras -Hur vi samlar in data. -Hur data analyseras och vilka slutsatser som kan dras från data. -Hur insamlad.
Kvantitativ metod (Intro) Vad är statistik? När kan man använda statistiska metoder? De olika stegen i en statistisk undersökning –Problemformulering (syfte.
Föreläsning 1-3 Introduktion till kursen Beskrivande statistik.
Deskription + enkät Mätnivån styr hur man kan analysera data Tabeller – frekvenstabeller Diagram – cirkeldiagram, stapeldiagram, histogram, boxplot Beskrivande.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
1. Kontinuerliga variabler
1 Numeriska Deskriptiva Tekniker. 2 Centralmått §Vanligtvis fokuserar vi vår uppmärksamhet på två typer av mått när vi beskriver en population: l Centraläge.
Hypotesprövning. Statistisk hypotesprövning och hypotetisk-deduktiv metod Hypotetisk-deduktiv metod: –Hypotes: Alla svanar är vita. –Empirisk konsekvens:
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov Data, observationer.
STATISTISK METODIK 1. INLEDNING / VAD ÄR STATISTIK? 2. UNDERSÖKNINGSMETODIK 3. DESKRIPTION 4. SAMBAND.
Kap 4 - Statistik.
Marknadsundersökning Kap 12
Förelasning 1 Kursintroduktion Statistiska undersökningar
Grundl. statistik F2, ht09, AN
Presentationens avskrift:

732G81 Statistik Patrik.Waldmann@liu.se Föreläsning 3 732G81 Statistik Patrik.Waldmann@liu.se

Dagens föreläsning Population vs. Stickprov Läges och spridningsmått Kombinatorik Permutationer och kombinationer Sannolikhetslära Oberoende och disjunkta händelser Bayes sats Satsen om total sannolikhet 732G81

Population Den (oftast teoretiska) mängd enheter som vi vill dra slutsatser om. Kan anses vara ändlig eller oändlig. Ex: 50-åriga tallar i Sverige (variabel höjd) HIV-smittade i världen (variabel dödlighet) Ekonomistudenter vid LiU (variabel studiemotivation) 732G81

Stickprov Den fysiska mängd observationer som vi har data från. Bör vara ett slumpmässigt och representativt urval från den större bakomliggande populationen. Ex: Talldungen på Campus? HIV-smittade på gayklubbar i Stockholm? Ekonomistudenter på denna föreläsning? 732G81

Lägesmått och spridningsmått Illustrerat med programmet R #Generera 1000 dataobservationer från en normalfördelning med #medelvärde 40 och standardavvikelse 2. data1 <- rnorm(1000,40,2) #Generera 1000 dataobservationer från en normalfördelning med #medelvärde 50 och standardavvikelse 10. data2 <- rnorm(1000,50,10) 732G81

Lägesmått och spridningsmått Illustrerat med programmet R #Plotta ett histogram var för data 1 och data 2 #(med 25 staplar). hist(data1,25,xlim=c(1,100)) hist(data2,25,xlim=c(1,100)) 732G81

Lägesmått och spridningsmått Illustrerat med programmet R #Checka att medel och standardavvikelse stämmer mean(data1) 40.02254 sd(data1) 1.972034 mean(data2) 50.2357 sd(data2) 10.20776 732G81

Kombinatorik Permutationer Permutationer när alla element är olika: Visa att mängden S = {1,2,3,4} har 24 möjliga permutationer: (1,2,3,4), (1,2,4,3), (1,4,2,3), … , och (4,3,2,1) 𝑃 𝑛 𝑘 = 𝑛! 𝑛−𝑘 ! = 4! 4−4 ! = 24 1 =24 732G81

Kombinatorik Permutationer Permutationer när alla element är olika: På hur många sätt kan två värden väljas ut ur S = {1,2,3,4}: (1,2), (1,3), (1,4), (2,1), (3,1), (4,1), … , och (4,3) 𝑃 𝑛 𝑘 = 𝑛! 𝑛−𝑘 ! = 4! 4−2 ! = 24 2 =12 Olika ordning 732G81

Kombinatorik Permutationer Permutationer när vissa element är lika: Hur många åttasiffriga nummer kan bildas av S = {1,2,3,4,1,2,3,4} (varje siffra ska ingå två gånger) : 𝑃 𝑛 𝑘 1 , 𝑘 2 , = 𝑛! 𝑘 1 ! 𝑘 2 ! 𝑘 3 ! 𝑘 4 ! = 8! 2!2!2!2! = 40320 16 =2520 732G81

Kombinatorik Kombinationer Kombinationer utan upprepning: Visa att mängden S = {1,2,3,4} bara kan kombineras en gång utan upprepning: (1,2,3,4) anses vara samma som (1,2,4,3), … , och (4,3,2,1) 𝑃 𝑛 𝑘 = 𝑛! 𝑘! 𝑛−𝑘 ! = 4! 4! 4−4 ! = 24 24 =1 732G81

Kombinatorik Kombinationer Kombinationer utan upprepning: Vilka par kan väljas ut ur S = {1,2,3,4}: (1,2), (1,3), (1,4), (2,1), (3,1), (4,1), … , och (4,3) 𝑃 𝑛 𝑘 = 𝑛! 𝑘! 𝑛−𝑘 ! = 4! 2! 4−2 ! = 24 4 =6 Anses vara samma 732G81

Kombinatorik Kombinationer Kombinationer med upprepad dragning: Vilka par kan väljas ut ur S = {1,2,3,4}, givet att varje siffra kan bilda ett par med sig själv: (1,1), (1,2), (1,3), (1,4), … , och (4,4) 𝑃 𝑛 𝑘 = 𝑛+𝑘−1 ! 𝑘! 𝑛−1 ! = 4+2−1 ! 2! 4−1 ! = 120 12 =10 732G81

Sannolikhetslära Definitioner Utfallsrummet för könet på ett barn är S = {F,P} Sannolikheten för att få ett barn med ett visst kön är P(F) = P(P) = ½ Utfallsrummet för könet på två barn är S = {(F,F),(F,P),(P,F),(P,P)} Sannolikheten för var och en av dessa utfall är P((X,Y)) = ¼ 732G81

Sannolikhetslära Händelser och union Könet på två barn i samma familj är oberoende (F hänt så kan P hända) händelser och kan därför inte vara disjunkta (F hänt så kan inte P hända) Definiera två nya händelser E = {(F,F),(F,P)} dvs första barnet av två är en flicka F = {(F,F),(P,F)} dvs andra barnet av två är en flicka Unionen mellan E och F E∪F dvs händelsen att antingen det första eller det andra barnet är en flicka 𝑃 E∪F =𝑃 E +𝑃 F −𝑃 E∩F =0.5+0.5−𝑃 F,F = ¾ Snittet mellan E och F 732G81

Sannolikhetslära Betingade sannolikheter Vad är sannolikheten för två flickor 𝑃 F,F =𝑃 F ∙𝑃 F =0.5 ∙0.5=0.25 En familj har två barn. Vad är den betingade sannolikheten att båda barnen är flickor givet att minst en av dem är det Låt I=𝑃 F,F och J=minst en är flicka 𝑃 𝐼 𝐽 = 𝑃 𝐼∩𝐽 𝑃 𝐽 = 𝑃 F,F 𝑃{ F,F , F,P , P,F } = 0.25 0.75 = 1 3 732G81

Sannolikhetslära Bayes sats Ett test på ett laboratorium har 95% effektivitet i att detektera en sjukdom när sjukdomen verkligen existerar. Testet resulterar dock också i 1% felaktiga positiva resultat när friska personer testas. Om 0.5% av befolkningen verkligen har sjukdomen, vad är sannolikheten att en individ har sjukdomen givet att testet är postivt? 732G81

Sannolikhetslära Bayes sats Låt 𝐷 beteckna händelsen att en person har sjukdomen och 𝐸 händelsen att testet är positivt. Den eftersökta sannolikheten är 𝑃 𝐷 𝐸 och erhålls mha Bayes sats 𝑃 𝐷 𝐸 = 𝑃 𝐷∩𝐸 𝑃 𝐸 = 𝑃 𝐸 𝐷 𝑃 𝐷 𝑃 𝐸 𝐷 𝑃 𝐷 +𝑃 𝐸 𝐷 𝑐 𝑃 𝐷 𝐶 = 0.95 0.005 0.95 0.005 + 0.01 0.995 = 95 294 ≈0.323 Bara 32 procent av de som fått positivt testresultat har sjukdomen. 732G81

Tips om ytterligare information Hemsida med exempel på permutationer (eng. permutations) och kombinationer (eng. combinations) http://www.artofproblemsolving.com/Wiki/index.php/Combinat orics/Introduction Skillnaden på disjunkta (eng. disjoint) och oberoende (eng. independent) händelser beskrivs i följande video: http://www.youtube.com/watch?v=hqgZF3H0lxM Bra exempel på Bayes sats (eng. Bayes theorem) finns bl a på: http://www.kevinboone.net/bayes.html 732G81