Ladda ner presentationen
Presentation laddar. Vänta.
Publicerades avMarie Sundström
1
Statistisk hypotesprövning
2
Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares påstående att den sätter 70 % av alla sina straffar? I en fabrik: Fungerar maskinen som fyller schampoflaskor korrekt? Finns det någon skillnad i resultatet från en ny behandling jämfört med den traditionella?
3
Resonemanget bakom statistisk hypotesprövning Formellt: Hypotetisk-deduktiv metod (utgår ifrån ett påstående, en s.k. nollhypotes) Jämför detta påstående med verkligheten Exempel: Anna påstår att hon sätter 70 % av alla sina straffar Vi ber henne bevisa detta för oss. Hon lägger 20 straffar och lyckas sätta 9 av dessa Vi drar slutsatsen att om det stämmer att hon sätter 70 %, så skulle hon nästan aldrig sätta så få som 9 av 20 Slutsats: Vi tror inte på hennes påstående.
4
Samma resonemang i ett statistiskt test: – Om vi antar att påståendet (nollhypotesen) är sant, hur troligt är det att se det vi ser i verkligheten (dvs. i vårt stickprov)? – Om vi ser någonting som är mycket osannolikt, givet att nollhypotesen är sann, drar vi slutsatsen att det är troligt att nollhypotesen inte stämmer och vi förkastar nollhypotesen.
5
Antag att en fabrik som tillverkar schampo som i genomsnitt ska väga 300 gram misstänker att maskinen som fyller schampoflaskorna inte fungerar korrekt Nollhypotes (H 0 ): Medelvikten av schampoflaskorna är 300 gram Alternativhypotes (H A ): Medelvikten är inte 300 gram Empirisk konsekvens: Om medelvikten hos schampoflaskorna är 300 gram så borde ett slumpmässigt urval av dessa ge ett stickprovsmedelvärde som inte skiljer sig alltför mycket från 300. Om nollhypotesen är sann så är det en osannolik händelse att i en urvalsundersökning observera ett stickprovsmedelvärde som skiljer sig mycket från det förväntade.
6
Exempelvis så kan man välja att definiera en ”osannolik händelse” som en händelse som bara inträffar 5 gånger av 100 om nollhypotesen är sann I statistiska termer kallas det för att man har valt signifikansnivån, α, 0,05, eller 5 % (Vanliga signifikansnivåer är 0.05, 0.01 och 0.10)
7
Hur avgör vi då om det som vi ser i vårt stickprov är en ”osannolik händelse”? Vi tittar på samplingfördelningen för vår teststatistika (t.ex. stickprovsmedelvärdet)! Den säger oss hur fördelningen för vår teststatistika borde se ut då nollhypotesen är sann.
8
Utifrån vår nollhypotes och sannolikhetsteorin kan vi säga vad värdet på teststatistikan (t.ex. stickprovsmedelvärdet) troligtvis kommer att bli då nollhypotesen är sann. Sedan drar vi ett stickprov och räknar ut värdet på teststatistikan Får vi ett värde som är osannolikt under nollhypotesen så förkastar vi nollhypotesen
9
Forts. fabriksexemplet: Antag att vi tar ett stort stickprov från populationen av schampoflaskor. – Då vet vi att om vi tar upprepade stickprov av samma storlek från denna population, så kommer stickprovsmedelvärdets variation från stickprov till stickprov att följa en normalfördelning med standardavvikelsen: – Och om nollhypotesen är sann och populationsmedelvärdet för flaskorna är 300 så kommer samplingfördelningen för stickprovsmedelvärdet att vara centrerad kring 300
10
– Empirisk konsekvens: Om nollhypotesen är sann så är sannolikheten 0.95 att få ett stickprovsmedelvärde som ligger max från , dvs. från 300. Med andra ord förväntas stickprovsmedelvärdet ge ett z- värde mellan -2 och 2 om nollhypotesen är sann.
11
– Exempel på observation: Stickprovsmedelvärdet ligger mer än två standardavvikelser från den nollhypotes vi har om populationsmedelvärdet (dvs. vi får ett z-värde som är mindre än –2 eller större än 2) – Slutsats: Förkasta nollhypotesen. – Om nollhypotesen är sann är sannolikheten mycket liten, endast 0,05, att jag skall få en observation på stickprovsmedelvärdet som ligger så långt ifrån populationsmedelvärdet. Antingen har jag sett något som är osannolikt eller så är nollhypotesen falsk.
12
Antag att vi vet att schampoflaskpopulationens standardavvikelse är σ=24. Vi skall ta ett stickprov bestående av n=36 enheter: – Nollhypotes (H 0 ): = 300, – Alternativhypotes (H A ): ≠ 300 – Signifikansnivå: α= – Teststatistika: Stickprovsmedelvärdet, som är normalfördelat med standardavvikelsen och (om nollhypotesen är sann) medelvärdet 300.
13
– Kritiska gränser: Med signifikansnivån 5% skall vi förkasta nollhypotesen om stickprovsmedelvärdet är mindre än eller större än Ekvivalent kan vi förkasta nollhypotesen om z-värdet är mindre än -2 eller större än 2.
14
– Observation: Vi drar ett stickprov och beräknar stickprovsmedelvärdet till 310 (vilket ger z = 2,5). – Slutsats: Förkasta nollhypotesen. Medelvikten av schampoflaskorna är inte 300, maskinen fungerar inte korrekt.
15
15 P-värden Ett p-värde är sannolikheten att, om nollhypotesen är sann, vid en upprepning av försöket få ett minst lika ”extremt” värde på teststatistikan som det vi faktiskt fått. Om p-värdet är litet har jag antingen sett något som är osannolikt eller också är nollhypotesen falsk Om p-värdet är tillräckligt litet (t.ex. < 0.05 eller < 0.01) förkastas nollhypotesen
16
16 Forts. på exempel: – H 0 : = 300, H A : 300. – Vi får observationen z = 2,5 (stickprovsmedelvärdet blev 310). – P-värdet = (Sannolikheten att få ett stickprovsmedelvärde som ligger minst 2,5 standardavvikelser från 300) = 0.0124. – Observera att vi, med α=0,05, skall förkasta nollhypotesen om p-värdet är under 0,05. – Om nollhypotesen kan förkastas säger man ibland att resultatet är ”signifikant” eller ”statistiskt säkerställt”.
17
Exempel: Annas påstående om sin förmåga att sätta straffar Nollhypotes: p=0,7 Alternativhypotes: p < 0,7 Signifikansnivå: α=0,05 Observerad teststatistika: Vilket ger ett z-värde på
18
P-värdet = (Sannolikheten att få en stickprovsproportion som ligger minst 2,4 standardavvikelser under populationsproportionen, om nollhypotesen är sann)=0,0082 0,0082<0,05 Slutsats: Vi har tillräckligt starka belägg för att förkasta nollhypotesen.
19
Test av skillnad mellan två medelvärden Om man t.ex. vill jämföra två behandlingar. Nollhypotesen: det finns ingen skillnad mellan populationsmedelvärdena. Alternativhypotesen: det finns en skillnad. Använder oss egentligen av ett s.k. t-test. Vi förkastar nollhypotesen om skillnaden mellan stickprovsmedelvärdena är tillräckligt stor, dvs. vi får ett p- värde under 0,05.
20
Exempel: Skillnad i effekten på rörlighet mellan massage med traditionell massageolja och massage med en ny typ av massagolja Vi har randomiserat 40 personer, 20 till vardera behandling, och mäter deras rörlighet före och efter behandlingen enligt en 10-gradig skala. Nollhypotes: Det finns ingen skillnad gällande den genomsnittliga ökningen av rörligheten mellan de två behandlingarna Alternativhypotes: Det finns en skillnad Signifikansnivå: α=0,05
21
Den genomsnittliga rörlighetsökningen med traditionell massageolja blev ca 1,0 Den genomsnittliga rörlighetsökningen med den nya massageoljan blev ca 1,3 Skillnaden är alltså ca 0,2 Med hjälp av en dator räknar vi ut p-värdet, som blir ca 0,67 0,67>0,05 Slutsats: Vi kan ej förkasta nollhypotesen. Vi har alltså inte tillräckligt starka belägg för att säga att det finns en skillnad mellan de två massageoljorna vad gäller påverkan på rörligheten.
22
Att tänka på när man gör en undersökning Följ stegen (Syfte och problemformulering, Planering…) Definiera populationen tydligt Beskriv hur datainsamlingen gått till och använd slumpmässiga metoder där det är möjligt Ange stickprovsstorleken Beskriv dina variabler och hur dessa har mätts
23
Nämn eventuellt bortfall (både individ- och partiellt-) och andra problem som kan ha uppstått När du fått in dina data: Börja med att titta på hur de ser ut! Fråga dig själv om resultaten verkar rimliga. Ange aldrig bara ett p-värde utan att också redovisa de skattningar som ligger till grund för det
Liknande presentationer
© 2024 SlidePlayer.se Inc.
All rights reserved.