Normalfördelningen och centrala gränsvärdessatsen

Slides:



Advertisements
Liknande presentationer
Punkt- och intervallskattning Felmarginal
Advertisements

Inferens om en population Sid
Hej hypotestest!. Bakgrund  Signifikansanalys  Signifikansprövning  Signifikanstest  Hypotesprövning  Hypotestest Kärt barn har många namn Inblandade:
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Exempel Utifrån medicinsk erfarenhet är 5% av befolkningen smittade av ett visst virus. Ett nytt test har visat sig ge 80% av de smittade korrekt diagnos.
FL8 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
FL5 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
Inferens om en ändlig population Sid
Jämförelse av två populationer Sid
Kapitel 5 Stickprovsteori Sid
F11 Olika urvalsmetoder, speciellt obundet slumpmässigt urval (OSU)
Workshop i statistik för medicinska bibliotekarier!
Vad ingår kursen? i korta drag
Tillämpad statistik Naprapathögskolan
Felkalkyl Ofta mäter man inte direkt den storhet som är den intressanta, utan en grundläggande variabel som sedan används för att beräkna det som man är.
Skattningens medelfel
Grundläggande Biostatistik
2. Enkel regressionsanalys
Experimentell utvärdering Språkteknologisk forskning och utveckling (HT 2006)
Förelasning 6 Hypotesprövning
Centrala Gränsvärdessatsen:
FK2002,FK2004 Föreläsning 2.
Föreläsning 81 Sampling och urval Ofta möter vi påståenden av typen “4.5 miljoner svenskar såg VM-finalen i fotboll”, “en svensk tolvåring väger i genomsnitt.
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
FL7 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Binomialsannolikheter ritas i ett stolpdiagram
Statistikens grunder 2 dagtid
Egenskaper för punktskattning
Sannolikhet Stickprov Fördelningar
Simulering Introduktion Exempel: Antag att någon kastar tärning
Föreläsning 7 Fysikexperiment 5p Poissonfördelningen Poissonfördelningen är en sannolikhetsfördelning för diskreta variabler som är mycket.
Linjär regression föreläsning 9
Övningsexempel till Kapitel 7 Ex 1. BRÄNNBOLLSDILEMMAT ! En person funderar över hur man bäst uppskattar 28 meter. Av erfarenhet vet han att hans steglängd,
Matematisk statistik och signal-behandling - ESS011 Föreläsning 3 Igor Rychlik 2015 (baserat på föreläsningar av Jesper Rydén)
F8 Hypotesprövning. Begrepp
F8 Hypotesprövning. Begrepp
Forskningsmetodik Sampling och urval Hypotesprövning Lektion 9
Slumptal Pseudoslumptal Fysikexperiment 5p Föreläsning 2
Mål Matematiska modeller Biologi/Kemi Statistik Datorer
Fysikexperiment, 5p1 Random Walk 36 försök med Random walk med 1000 steg. Beräknad genomsnittlig räckvidd är  1000  32. Visualisering av utfallsrum.
732G22 Grunder i statistisk metodik
VetU termin 4 moment 3 Analysera nivåer av kalium och kreatinin Mätningar genomförda på 120 män och 120 kvinnor (tidigare studenter KI) Dagens uppgift:
1 Fler uträkningar med normalfördelningstabell Låt X vara Nf(170,5). Beräkna Lösning:
Grundläggande statistik, ht 09, AN
Grundläggande statistik, ht 09, AN1 F6 Slumpmässigt urval 1. Population där X är diskret med fördelningen p(x). Medelvärdet μ och variansen σ². Observationer:
Forskningsmetodik lektion
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
1 Normalfördelningsmodellen. 2 En modell är en förenklad beskrivning av någon del av verkligheten. Beskrivningen måste vara relevant för det vi skall.
1 Stokastiska variabler. 2 Variabler En variabel är en egenskap hos en individ /objekt. En variabel kan, som vi tidigare sett, vara kvalitativ eller kvantitativ.
SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ Timmar/
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
Medicinsk statistik II Läkarprogrammet T5 HT 2013 Susann Ullén FoU-centrum Skåne Skånes Universitetssjukhus.
Vetenskaplig metod Statistik 1. VAD ÄR STATISTIK? 2. DESKRIPTION 3. URVAL 4. STATISTISK INFERENS OCH HYPOTESPRÖVNING a) t-test b) ickeparametriska test.
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
1. Kontinuerliga variabler
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
1 I. Statistiska undersökningar Ett gemensamt syfte för alla undersökningar är att få ökad kunskap om ett visst problemområde Det kanske viktigaste sättet.
Hypotesprövning. Statistisk hypotesprövning och hypotetisk-deduktiv metod Hypotetisk-deduktiv metod: –Hypotes: Alla svanar är vita. –Empirisk konsekvens:
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov Data, observationer.
Samband & Inferens Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband mellan kvot-varibaler –Korrelationskoefficient.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
INFERENS OCH SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ.
Marknadsundersökning Kap 12
naaf. no/Documents/Allergi%20i%20Praksis/Aip4_06_Karelen
Y 5.4 Tabeller och diagram Frekvens och relativ frekvens
Presentationens avskrift:

Normalfördelningen och centrala gränsvärdessatsen Om vi summerar ett stort antal slumpmässigt fördelade tal, så kommer den asymptotiska fördelningen för summan att gå mot en normalfördelning Detta gäller oberoende av hur fördelningen ser ut för de termer som ingår i summan!!

“De stora talens välsignelse” Felet i medelvärdet Det vill säga standardavvikelsen hos normalfördelningen I fråga (uppskattad med variansen av datapunkterna) dividerad med kvadratroten ur antalet mätvärden). “De stora talens välsignelse”

Felfortplantning

Statistisk signifikans Resultatet av en mätning (observation) sägs vara statistiskt signifikant om det är osannolikt att resultatet beror på slumpen. Tex: Sannolikheten att det inträffat på grund av slumpen är mindre än 0,05 (dvs 1 på 20) Sannolikheten att det inträffat på grund av slumpen är mindre än 0,01 (dvs 1 på 100)

Men kom ihåg!! Sannolikheten att det inträffat på grund av slumpen är mindre än 0,05 (dvs 1 på 20) En gång på 20 är det ”signifikant” på grund av slumpen!!!!!!!!!!! Signifikansnivån är mycket viktig!! 0,05, 0.001, 10-6 …..

Olika sannolikheter Om man kan anta på goda grunder att en viss händelse sker kallas det teoretisk sannolikhet. Om man baserar sannolikheten på observerade händelser kallas det relativ frekvenssannolikhet Om man baserar sannolikheten på erfarenhet och intuition kallas det subjektiv sannolikhet

Sannolikhetsfördelningen för summan av två tärningar Utfall Kombinationer antal Sannolikhet 1+1 1 1/36 1+2, 2+1 2 2/36 1+3, 3+1, 2+2 3 3/36 1+4, 4+1, 2+3, 3+2 4 4/36 1+5, 5+1, 2+4, 4+2, 3+3 5 5/36 1+6, 6+1, 2+5, 5+2, 3+4, 4+3 6 6/36 2+6, 6+2, 3+5, 5+3, 4+4 5 5/36 3+6, 6+3, 4+5, 5+4 4 4/36 4+6, 6+4, 5+5 3 3/36 5+6, 6+5 2 2/36 12 6+6 1 1/36

Verklig korrelation?

Bakgrundsfaktorer som ger falsk korrelation Exempel: Under vintern säljs mindre glass, sker fler benbrott, dricks mer glögg, säljs fler skidresor och fler åker buss till jobbet än på sommaren. Men det är väl ingen som drar slutsatsen att det är ökad bussåkning som ger upphov till ökad glöggkonsumtion. Det beror mer på det kalla vädret.

Möjliga förklaringar för en korrelation Statistisk fluktuation (se tabell 7.3) Bakomliggande faktorer (tex väder etc) En variabel beror av den andra (ett kausalt samband)

Kausalitet En korrelation mellan två variabler kan indikera en kausalitet (en variabel beror av den andra) men inte ensam bevisa att man har en kausalitet. En mängd andra undersökningar behövs!

Riktlinjer för att visa kausalitet Kontroller att korrelationen existerar även när andra parametrar varieras Kontrollera att korrelationen förstärks då en misstänkt parameter förstärks Om effekten kan orsakas av någon känd effekt, kontrollera att effekten finns kvar då man tagit hänsyn till den kända effekten. Försök att göra ett experiment Försök finna en fysisk orsak till korrelationen

Ex. hur man visade att rökning orsakade lungcancer Observerad korrelation mellan rökning och lungcancer för alla typer av människor Man fann att för människor med lika förutsättningar att icke rökare hade mer sällan lungcancer än rökare Folk som rökte mycket och länge hade högre chans att få luncancer När man korrigerade för kända orsaker till lungcancer som tex radon hade rökare fortfarande högre frekvens än icke rökare Man gjorde djurförsök och fann att de ”rökande” fick lungcancer Biologer studerade cellkulturer och fann att röken orsakade mutationer och att det inte fanns någon genetisk faktor

Kombination av sannolikheter

Medelvärdet hos en population Medelvärdet för fem basketspelare är 242,4 pound Vi delar upp de fem i så många samplestorlekar som möjligt Samplestorlek 1 2 3 4 5 Antal möjliga samples 10

Egenskaper Medelvärdet är detsamma för de olika fördelningarna Spridningen blir mindre ju större sample

Samplemedelvärden för större populationer Populationsmedelvärdet (m) på samtliga personer i populationen är det sanna värdet. Ett urval (sample) med en del av populationen kommer att ha ett medelvärde (x) som skiljer sig något från populationsmedelvärdet (m) Men medelvärdet för en mängd olika samples kommer att vara normalfördelade med ett medelvärde nära m

Andelar av en population För en ja/nej fråga har man bara två svar och vi har att en andel av populationen Tex p= 550/1100 = 0,50 För en delmängd (sample) av populationen har vi p = 50/100 Standardavvikelsen hos p är ^

95% konfidensintervall Uppskatta ”felmarginalen”,E, för 95% KI E=1,96s/ n (s= standardavvikelsen för samplet) x - E < m < x + E Betyder att 95% av alla samplemedelvärden ligger inom intervallet

95% konfidensintervall för andelar av en population Felmarginalen, E, för 95% konfidensintervallet är:

Uppskattning av samplestorlek

Uppskattning av samplestorlek for andelar av en population

Hypotesprövning Nollhypotesen H0 är den man testar Alternativa hypotesen Ha antar att parametern som testas avviker från H0 Definitionen av hypoteserna skall bestämmas innan man utför testen!!!

Hypotestestning Man behöver: 1. Det antagna värdet för populationsparametern (m) eller p 2. Medelvärdet x eller p 3. Samplestorleken, n 4. Standardavvikelsen för populationen, s, eller för stora samples standardavvikelsen för samplet, s ^

P-värdet P-värdet för en hypotes om en parameter är sannolikheten att ett sample minst lika extremt som det observerade, under antagandet att nollhypotesen är sann.

Signifikans vid 0.05 nivån för ensidigt intervall

Signifikans vid 0,05 nivå för tvåsidigt intervall

Fel i hypotesprövningen H0 sann H0 falsk Förkasta H0 Feltyp 1 Korrekt Acceptera H0 Korrekt Feltyp II Vid en signifikansnivå på 0,05 kommer vi att förkasta H0 i 5% av fallen. Signifikansnivån är sannolikheten för Feltyp 1