Hypotesprövning. Statistisk hypotesprövning och hypotetisk-deduktiv metod Hypotetisk-deduktiv metod: –Hypotes: Alla svanar är vita. –Empirisk konsekvens:

Slides:

Advertisements

Liknande presentationer

Inferens om en population Sid

Advertisements

Förelasning 6 Hypotesprövning

FL7 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,

Forskningsmetodik Sampling och urval Hypotesprövning Lektion 9

732G22 Grunder i statistisk metodik

Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.

Genomgång - biostatistik Fråga 1 I en liten undersökning efterfrågades uppgifter om ålder hos 20 personer med högt blodtryck se tabell a)Beräkna.

Föreläsning 8 732G81. Kapitel 8 Inferens om en ändlig population Sid

SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ Timmar/

Föreläsning 6 732G81. Kapitel 6 Inferens om en population Sid

  2 f ( 2 ) Chi-Square Distribution: df=10, df=30, df=50 df = 10 df = 30 df = 50 Chi-2-fördelningen.

Introduktion. Exempel: Till ett försök med bantningsmedlet Bantomid anmälde sig 14 personer frivilligt, alla med övervikt. De delades slumpmässigt in.

Introduktion. Kenny Bränberg Steg 3 + specialkurser Tränare i Sävar IK och assisterande tränare i Mariehem SK. 16 års tränarerfarenhet. Alla åldersgrupper.

Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.

Samband mellan kvalitativa variabler Korstabeller Moore kapitel 2.5 och kapitel 9.

Toppning vs. Nivåindelning IK Zenith F02 Per-Olof Johansson.

Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.

En viktig fråga för dygdetiken: Kan D ge ett bra svar på frågan ‘Vad bör jag göra?’?

Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.

Samband & Inferens Konfidensintervall Statistisk hypotesprövning

INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.

Repetition av Chi2-test Kap 6, Kodning av svaren Kap 10, Olika feltyper Kap 12, Rapportskrivning.

INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov Data, observationer.

Samband & Inferens Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband mellan kvot-varibaler –Korrelationskoefficient.

INFERENS OCH SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ.

1 Utvärdering och tolkning: MBA Program Admission Policy Rektorn vid ett stort universitet vill höja standarden på de som antas till deras populära MBA-program.

4.1 Grundläggande sannolikhetslära När osäkerhet förekommer kan man aldrig uttala sig tvärsäkert. Istället använder vi sannolikheter, väntevärden, standardavvikelser.

Vad är kunskap Vetenskapsteori.

Regiongemensam enkät i förskola och familjedaghem 2016

Kommande moment Idag: Gruppövning 1 Historiesyn

regeringen. se/rattsdokument/proposition/2017/02/prop

Insikt 2015 Söderköpings kommun

INFÖR NATIONELLA PROVET

Regiongemensam enkät i förskola och familjedaghem 2016

INFÖR NATIONELLA PROVET

Kap 4 - Statistik.

Formell logik Kapitel 3 och 4

Vetenskap = fakta, teorier, metoder

Regiongemensam enkät i förskola och familjedaghem 2016

Diskutera! När vi diskuterar så är vi två eller fler som pratar tillsammans. När man diskuterar tycker man något! Om jag tycker något så kan man säga att.

Regiongemensam enkät i förskola och familjedaghem 2016

Regiongemensam enkät i förskola och familjedaghem 2016

Regiongemensam enkät i förskola och familjedaghem 2016

Regiongemensam enkät i förskola och familjedaghem 2016

Regiongemensam enkät i förskola och familjedaghem 2016

Regiongemensam enkät i förskola och familjedaghem 2016

Regiongemensam enkät i förskola och familjedaghem 2016

Regiongemensam enkät i förskola och familjedaghem 2016

Regiongemensam enkät i förskola och familjedaghem 2016

Regiongemensam enkät i förskola och familjedaghem 2016

Regiongemensam enkät i förskola och familjedaghem 2016

Regiongemensam enkät i förskola och familjedaghem 2016

Regiongemensam enkät i förskola och familjedaghem 2016

Regiongemensam enkät i förskola och familjedaghem 2016

Regiongemensam enkät i förskola och familjedaghem 2016

Regiongemensam enkät i förskola och familjedaghem 2016

Regiongemensam enkät i förskola och familjedaghem 2016

Regiongemensam enkät i förskola och familjedaghem 2016

Regiongemensam enkät i förskola och familjedaghem 2016

Regiongemensam enkät i förskola och familjedaghem 2016

Regiongemensam enkät i förskola och familjedaghem 2016

Relation mellan variabler – samvariation, korrelation, regression

Vad ingår kursen? i korta drag

Föreläsningsanteckningar till:

Regiongemensam enkät i förskola och familjedaghem 2016

Regiongemensam enkät i förskola och familjedaghem 2016

Regiongemensam enkät i förskola och familjedaghem 2016

En genomsnittlig svensks utsläpp – 11 ton CO2/år

Regiongemensam enkät i förskola och familjedaghem 2016

Saker att ta upp… Skärpning av reglerna omkring MKN vatten

Presentationens avskrift:

Hypotesprövning

Statistisk hypotesprövning och hypotetisk-deduktiv metod Hypotetisk-deduktiv metod: –Hypotes: Alla svanar är vita. –Empirisk konsekvens: Om a är en svan så är a vit. Om jag väljer en svan slumpmässigt så är den säkert vit, givet att hypotesen är sann. –Observation (exempel): a är en svan och a är svart. –Slutsats: Hypotesen är falsk. Förkasta hypotesen.

–Om hypotesen är sann kan jag omöjligt se en svan som är svart. Statistisk hypotesprövning: –Hypotes:  =  0

–Empirisk konsekvens: Sannolikheten att få ett stickprovsmedelvärde som ligger max 1.96 (eller ungefär 2) standardavvikelser, dvs ifrån  0 är 0,95. Det är alltså inte säkert, men sannolikheten är hög. Om jag drar ett urval slumpmässigt och beräknar stickprovsmedelvärdet förväntar jag mig att få ett värde som ligger max 1.96 standardavvikelser från nollhypotesens värde (ett z-värde mellan –1.96 och 1.96), eftersom sannolikheten är så hög (0,95) att hamna där, givet att hypotesen är sann.

–Observation (exempel): Stickprovsmedelvärdet ligger mer än 1.96 standardavvikelser från den hypotes vi har om populationsmedelvärdet (ekvivalent får vi ett z-värde som är mindre än –1.96 eller större än 1.96) –Slutsats: Förkasta hypotesen. –Om hypotesen är sann är sannolikheten mycket liten, endast 0,05, att jag skall få en observation på stickprovsmedelvärdet som ligger så långt ifrån populationsmedelvärdet. Observera att det inte är omöjligt, men att sannolikheten är liten.

Formulering av hypoteser Test av ett populationsmedelvärde eller en populationsproportion. –Dubbelsidigt test: H 0 :  =  0, H 1 :   0 H 0 : p = p 0, H 1 : p  p 0 Vi vill se om vi kan få empiriskt stöd för hypotesen att   0 (eller p  p 0 ). Observera att det vi vill undersöka om vi kan få stöd för (det vi vill ”bevisa”) sätts i alternativhypotesen.

Att förkasta nollhypotesen är ett ”starkt” beslut, vi har starkt empiriskt stöd för alternativhypotesen. Att ej förkasta nollhypotesen är ett ”svagt” beslut. Vi kan i regel ej dra slutsatsen att nollhypotesen är sann bara för att ”bevisen” inte räcker för att hävda motsatsen. Enkelsidigt test: H 0 :  =  0  H 1 :  >  0 H 0 : p =  p 0, H 1 : p > p 0 Vi vill se om vi kan få stöd för hypotesen att  >  0 (p > p 0 ). H 0 :  =  0  H 1 :  <  0 H 0 : p =  p 0, H 1 : p < p 0 Vi vill se om vi kan få stöd för hypotesen att  <  0 (p < p 0 ).

Test av skillnad mellan två populationsmedelvärden. –Dubbelsidigt test. Oftast (dock inte alltid) är nollhypotesen att det inte finns någon skillnad. H 0 :  1 =  2, H 1 :  1   2 Ekvivalent kan vi skriva H 0 :  1 –  2 = 0, H 1 :  1 –  2  0

–Enkelsidigt test. Om vi vill undersöka om det finns empiriskt stöd för hypotesen att  1   2 skriver vi: H 0 :  1 =  2, H 1 :  1   2 Ekvivalent kan vi skriva H 0 :  1 –  2 = 0, H 1 :  1 –  2  0 Om vi vill undersöka om det finns empiriskt stöd för hypotesen att  1   2 skriver vi: H 0 :  1 =  2, H 1 :  1   2 Ekvivalent kan vi skriva H 0 :  1 –  2 = 0, H 1 :  1 –  2  0

Val av teststatistika Vi har olika teststatistikor för olika situationer. Principen är att man väljer en teststatistika vars fördelning är känd då nollhypotesen är sann. Vi vill ju veta vilka värden på teststatistikan vi kan förvänta oss och vilka värden som är osannolika om nollhypotesen är sann.

Kritiskt område För att kunna bestämma ett kritiskt område (rejection region) behöver vi, förutom en teststatistika vars fördelning är känd under nollhypotesen, även en signifikansnivå. Principen är att vi skall förkasta nollhypotesen om vi observerar något som, innan försöket utförs, är osannolikt om nollhypotesen är sann. Men hur osannolikt måste det vara? En vanlig gräns är Signifikansnivån är då 0.05, eller 5%.

Har vi bestämt oss för en signifikansnivå och vet teststatistikans fördelning under nollhypotesen kan vi härleda för vilka värden på teststatistikan vi skall förkasta nollhypotesen. Exempel: Normalfördelad population.  = 3 –H 0 :  = 10, H 1 :   10 –Signifikansnivå:  = 0.05

–Teststatistika: – Eller, ekvivalent: –I båda fallen gäller fördelningarna under förutsättning att nollhypotesen är sann.

–Dvs. om nollhypotesen är sann är sannolikheten 0.05 att få ett värde på stickprovsmedelvärdet som är mindre än eller större än –Ekvivalent kan vi säga att sannolikheten är 0.05 att få ett värde på Z som är mindre än eller större än 1.96.

–Kritiskt område: Förkasta nollhypotesen om eller om Ekvivalent kan vi förkasta nollhypotesen om eller om z > 1.96

Observation och slutsats När vi väl bestämt oss för vilka värden på teststatistikan vi skall förkasta nollhypotesen (ett ”kritiskt område”) samlar vi in data, beräknar en observation på teststatistikan och ser om vår observation hamnar i det kritiska området. Får vi ett värde i det kritiska området förkastas nollhypotesen. Får vi ett värde som ej är i det kritiska området förkastar vi inte nollhypotesen.

Fortsättning på exemplet. –Vi tar ett sampel omfattande 16 observationer. De kritiska gränserna blir då 8.53 och –Antag att vi får stickprovsmedelvärdet 12. –Slutsatsen blir då att förkasta nollhypotesen. Vi anser oss ha tillräckligt empiriskt stöd för alternativhypotesen. (”Bevisen” räcker för att ”fälla” nollhypotesen.) –Ekvivalent kan vi beräkna en observation på Z. Sätter vi in det observerade stickprovs- medelvärdet 12 och n = 16 får vi z = 2.67, vilket är utanför gränsen Slutsatsen blir naturligtvis densamma.

18 Typ I fel och typ II fel. Typ I fel: Att förkasta nollhypotesen då den är sann. Sannolikheten för detta är signifikansnivån . Typ II fel: Att ej förkasta nollhypotesen då den är falsk. Sannolikheten för detta kallas för 

19 P-värden Ett p-värde är sannolikheten att, om nollhypotesen är sann (vid en upprepning av försöket) få ett minst lika ”extremt” värde på teststatistikan som det vi faktiskt fått. Med ”extremt” avses i förhållande till nollhypotesen och vad som räknas som ”extremt” beror därför på hypoteserna.

20 Exempel 1: –H 0 :  = 10, H 1 :   0. –Antag att vi få observationen z = –P-värdet = Sannolikheten att få ett stickprovsmedelvärde som ligger minst 2.67 standardavvikelser från 10, dvs. sannolikheten att få ett värde på z som är större än 2.67 eller mindre än –2.67 = Exempel 2: –H 0 :   10, H 1 :   0 –z = 2.67 –P-värdet = Sannolikheten att få ett stickprovsmedelvärde som ligger minst 2.67 standardavvikelser över 10 =