Hypotesprövning
Statistisk hypotesprövning och hypotetisk-deduktiv metod Hypotetisk-deduktiv metod: –Hypotes: Alla svanar är vita. –Empirisk konsekvens: Om a är en svan så är a vit. Om jag väljer en svan slumpmässigt så är den säkert vit, givet att hypotesen är sann. –Observation (exempel): a är en svan och a är svart. –Slutsats: Hypotesen är falsk. Förkasta hypotesen.
–Om hypotesen är sann kan jag omöjligt se en svan som är svart. Statistisk hypotesprövning: –Hypotes: = 0
–Empirisk konsekvens: Sannolikheten att få ett stickprovsmedelvärde som ligger max 1.96 (eller ungefär 2) standardavvikelser, dvs ifrån 0 är 0,95. Det är alltså inte säkert, men sannolikheten är hög. Om jag drar ett urval slumpmässigt och beräknar stickprovsmedelvärdet förväntar jag mig att få ett värde som ligger max 1.96 standardavvikelser från nollhypotesens värde (ett z-värde mellan –1.96 och 1.96), eftersom sannolikheten är så hög (0,95) att hamna där, givet att hypotesen är sann.
–Observation (exempel): Stickprovsmedelvärdet ligger mer än 1.96 standardavvikelser från den hypotes vi har om populationsmedelvärdet (ekvivalent får vi ett z-värde som är mindre än –1.96 eller större än 1.96) –Slutsats: Förkasta hypotesen. –Om hypotesen är sann är sannolikheten mycket liten, endast 0,05, att jag skall få en observation på stickprovsmedelvärdet som ligger så långt ifrån populationsmedelvärdet. Observera att det inte är omöjligt, men att sannolikheten är liten.
Formulering av hypoteser Test av ett populationsmedelvärde eller en populationsproportion. –Dubbelsidigt test: H 0 : = 0, H 1 : 0 H 0 : p = p 0, H 1 : p p 0 Vi vill se om vi kan få empiriskt stöd för hypotesen att 0 (eller p p 0 ). Observera att det vi vill undersöka om vi kan få stöd för (det vi vill ”bevisa”) sätts i alternativhypotesen.
Att förkasta nollhypotesen är ett ”starkt” beslut, vi har starkt empiriskt stöd för alternativ- hypotesen. Att ej förkasta nollhypotesen är ett ”svagt” beslut. Vi kan i regel ej dra slutsatsen att nollhypotesen är sann bara för att ”bevisen” inte räcker för att hävda motsatsen. Enkelsidigt test: H 0 : = 0 H 1 : > 0 H 0 : p = p 0, H 1 : p > p 0 Vi vill se om vi kan få stöd för hypotesen att > 0 (p > p 0 ). H 0 : = 0 H 1 : < 0 H 0 : p = p 0, H 1 : p < p 0 Vi vill se om vi kan få stöd för hypotesen att < 0 (p < p 0 ).
Test av skillnad mellan två populationsmedelvärden. –Dubbelsidigt test. Oftast (dock inte alltid) är nollhypotesen att det inte finns någon skillnad. H 0 : 1 = 2, H 1 : 1 2 Ekvivalent kan vi skriva H 0 : 1 – 2 = 0, H 1 : 1 – 2 0
–Enkelsidigt test. Om vi vill undersöka om det finns empiriskt stöd för hypotesen att 1 2 skriver vi: H 0 : 1 = 2, H 1 : 1 2 Ekvivalent kan vi skriva H 0 : 1 – 2 = 0, H 1 : 1 – 2 0 Om vi vill undersöka om det finns empiriskt stöd för hypotesen att 1 2 skriver vi: H 0 : 1 = 2, H 1 : 1 2 Ekvivalent kan vi skriva H 0 : 1 – 2 = 0, H 1 : 1 – 2 0
Val av teststatistika Vi har olika teststatistikor för olika situationer. Principen är att man väljer en teststatistika vars fördelning är känd då nollhypotesen är sann. Vi vill ju veta vilka värden på teststatistikan vi kan förvänta oss och vilka värden som är osannolika om nollhypotesen är sann.
Kritiskt område För att kunna bestämma ett kritiskt område (rejection region) behöver vi, förutom en teststatistika vars fördelning är känd under nollhypotesen, även en signifikansnivå. Principen är att vi skall förkasta nollhypotesen om vi observerar något som, innan försöket utförs, är osannolikt om nollhypotesen är sann. Men hur osannolikt måste det vara? En vanlig gräns är Signifikansnivån är då 0.05, eller 5%.
Har vi bestämt oss för en signifikansnivå och vet teststatistikans fördelning under nollhypotesen kan vi härleda för vilka värden på teststatistikan vi skall förkasta nollhypotesen. Exempel: Normalfördelad population. = 3 –H 0 : = 10, H 1 : 10 –Signifikansnivå: = 0.05
–Teststatistika: – Eller, ekvivalent: –I båda fallen gäller fördelningarna under förutsättning att nollhypotesen är sann.
–Dvs. om nollhypotesen är sann är sannolikheten 0.05 att få ett värde på stickprovsmedelvärdet som är mindre än eller större än –Ekvivalent kan vi säga att sannolikheten är 0.05 att få ett värde på Z som är mindre än eller större än 1.96.
–Kritiskt område: Förkasta nollhypotesen om eller om Ekvivalent kan vi förkasta nollhypotesen om eller om z > 1.96
Observation och slutsats När vi väl bestämt oss för vilka värden på teststatistikan vi skall förkasta nollhypotesen (ett ”kritiskt område”) samlar vi in data, beräknar en observation på teststatistikan och ser om vår observation hamnar i det kritiska området. Får vi ett värde i det kritiska området förkastas nollhypotesen. Får vi ett värde som ej är i det kritiska området förkastar vi inte nollhypotesen.
Fortsättning på exemplet. –Vi tar ett sampel omfattande 16 observationer. De kritiska gränserna blir då 8.53 och –Antag att vi får stickprovsmedelvärdet 12. –Slutsatsen blir då att förkasta nollhypotesen. Vi anser oss ha tillräckligt empiriskt stöd för alternativhypotesen. (”Bevisen” räcker för att ”fälla” nollhypotesen.) –Ekvivalent kan vi beräkna en observation på Z. Sätter vi in det observerade stickprovs- medelvärdet 12 och n = 16 får vi z = 2.67, vilket är utanför gränsen Slutsatsen blir naturligtvis densamma.
18 Typ I fel och typ II fel. Typ I fel: Att förkasta nollhypotesen då den är sann. Sannolikheten för detta är signifikansnivån . Typ II fel: Att ej förkasta nollhypotesen då den är falsk. Sannolikheten för detta kallas för
19 P-värden Ett p-värde är sannolikheten att, om nollhypotesen är sann (vid en upprepning av försöket) få ett minst lika ”extremt” värde på teststatistikan som det vi faktiskt fått. Med ”extremt” avses i förhållande till nollhypotesen och vad som räknas som ”extremt” beror därför på hypoteserna.
20 Exempel 1: –H 0 : = 10, H 1 : 0. –Antag att vi få observationen z = –P-värdet = Sannolikheten att få ett stickprovsmedelvärde som ligger minst 2.67 standardavvikelser från 10, dvs. sannolikheten att få ett värde på z som är större än 2.67 eller mindre än –2.67 = Exempel 2: –H 0 : 10, H 1 : 0 –z = 2.67 –P-värdet = Sannolikheten att få ett stickprovsmedelvärde som ligger minst 2.67 standardavvikelser över 10 =