Ett stickprov kvantitativa data: t-test

Slides:



Advertisements
Liknande presentationer
Punkt- och intervallskattning Felmarginal
Advertisements

Bedömning av uppfyllelse av miljökvalitetsnormer
Inferens om en population Sid
Hej hypotestest!. Bakgrund  Signifikansanalys  Signifikansprövning  Signifikanstest  Hypotesprövning  Hypotestest Kärt barn har många namn Inblandade:
Den vetenskapliga artikeln
Användande av hjälpinformation: Kvotskattning
Samband mellan kvalitativa variabler Sid
FL8 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
FL9 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Inferens om en ändlig population Sid
Jämförelse av två populationer Sid
Skånes Universitetssjukhus
732G22 Grunder i statistisk metodik
Ett stickprov kvantitativa data: t-test
Hypotestest Om datamaterialet är väldigt osannolikt givet en viss idé (hypotes), kan man dra slutsatsen att idén faller på sin egen orimlighet… Om A så.
Hypothesis Testing Dan Hedlin Del 1
Workshop i statistik för medicinska bibliotekarier!
Vad ingår kursen? i korta drag
Tillämpad statistik Naprapathögskolan
Stickprovsförfaranden
Vibeke Horstmann, Inst för hälsa, vård, samhälle, Centre for Ageing and Supportive Environments Jämförelse av två behandlingar.
Sammanfatta siffrorna…
Skattningens medelfel
Grundläggande Biostatistik
Chitvå-test Regression forts.
Experimentell utvärdering Språkteknologisk forskning och utveckling (HT 2006)
Förelasning 6 Hypotesprövning
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
FL7 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Statsvetenskap 3, statsvetenskapliga metoder
Egenskaper för punktskattning
1 Kapitel 9 Interval Estimation Dan Hedlin. 2 Konfidensintervall vanligast för ”location problems”, dvs k.i. för medelvärde o.d. K.i. för t.ex. standardavvikelse.
FL6 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
F8 Hypotesprövning. Begrepp
F8 Hypotesprövning. Begrepp
Forskningsmetodik Sampling och urval Hypotesprövning Lektion 9
Statistik Lars Valter Fil.lic. Statistik
732G22 Grunder i statistisk metodik
Grundläggande statistik, ht 09, AN
Statistiska samband i trafikolyckor Av: Lina Forsberg Hangjin Lee Daniel Leo Carl-Mikael Westman.
Musikkompendium Test. Musikkompendium Test 2 Musikkompendium Test 3.
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
Föreläsning 8 732G81. Kapitel 8 Inferens om en ändlig population Sid
Medicinsk statistik Läkarprogrammet HT Medicinsk statistik Varför behöver Ni kunskap i medicinsk statistik? Självständigt arbete Kunna tolka resultat.
Kostvetenskapliga Metoder 1. VAD ÄR STATISTIK? 2. DESKRIPTION 3. NORMALFÖRDELNING 4. HYPOTESPRÖVNING a) t-test b) ickeparametriska test c) chitvåtest.
SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ Timmar/
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
Medicinsk statistik II Läkarprogrammet T5 HT 2013 Susann Ullén FoU-centrum Skåne Skånes Universitetssjukhus.
Deskription + enkät Mätnivån styr hur man kan analysera data Tabeller – frekvenstabeller Diagram – cirkeldiagram, stapeldiagram, histogram, boxplot Beskrivande.
  2 f ( 2 ) Chi-Square Distribution: df=10, df=30, df=50 df = 10 df = 30 df = 50 Chi-2-fördelningen.
Vetenskaplig metod Statistik 1. VAD ÄR STATISTIK? 2. DESKRIPTION 3. URVAL 4. STATISTISK INFERENS OCH HYPOTESPRÖVNING a) t-test b) ickeparametriska test.
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Vad är Statistik? Inom statistik teorin studeras -Hur vi samlar in data. -Hur data analyseras och vilka slutsatser som kan dras från data. -Hur insamlad.
Kostvetenskapliga Metoder 1. VAD ÄR STATISTIK? 2. DESKRIPTION 3. URVAL 4. STATISTISK INFERENS OCH HYPOTESPRÖVNING a) t-test b) ickeparametriska test c)
UTVÄRDERING OCH KVALITET Metod för utvärderingen viktig för utvärderingens status. En utvärdering utifrån ett vetenskapligt arbetssätt ger andra möjlighet.
Samband mellan kvalitativa variabler Korstabeller Moore kapitel 2.5 och kapitel 9.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
En sak i taget 1. Mata in data 2. Förbered data för beräkningar 3. Beräkna 1. Börja med att testa din hypotes 2. Därefter titta på ev bakomliggande faktorer.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
Hypotesprövning. Statistisk hypotesprövning och hypotetisk-deduktiv metod Hypotetisk-deduktiv metod: –Hypotes: Alla svanar är vita. –Empirisk konsekvens:
Föreläsning 7 (Kajsa Fröjd) Korstabeller och Chi-tvåtest Kap 2.5, Två/flera populationer och en kvalitativ variabel (”The first model” i Moore)
Korstabeller och logistisk regression Samband mellan kvalitativa variabler.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov Data, observationer.
Samband & Inferens Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband mellan kvot-varibaler –Korrelationskoefficient.
INFERENS OCH SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ.
Vad ingår kursen? i korta drag
Presentationens avskrift:

Ett stickprov kvantitativa data: t-test Nollhypotes H0: =3600 gram Alternativhypotes H1:   3600 gram Deskriptiv statistik: Möjligheter till inferens: Konfidensintervall Resultat: =3920 ± 281 3639<  <4201 (95%) Hypotestest (t-test): Resultat t= 2,51 p=0,029 Pojke Vikt 1 3655 2 3465 3 3900 4 3410 5 3720 6 4300 7 3570 8 4000 9 3625 10 4925 11 4190 12 4280 martin.gellerstedt@hv.se

Förutsättningar för t-test och motsvarande konfidensintervall Kvantitativa data Om stickprovet är litet måste variabeln som studeras vara normalfördelad Om stickprovet är stort fungerar analys trots avvikelse från normalfördelning (ju större stickprov desto större avvikelse kan accepteras). martin.gellerstedt@hv.se

Ett stickprov men förutsättningarna för t-test ej uppfyllda: teckentest är ett alternativ Nollhypotes: median=3600 Teckentest (Sign test) Om hypotesen stämmer borde hälften av differenserna vara negativa och hälften positiva. Resultat: 9 av 12 positiva. p= 0,15 dvs ej signifikant Vikt Förväntat Differens Tecken 3655 3600 55 + 3465 -135 - 3900 300 3410 -190 3720 120 4300 700 3570 -30 4000 400 3625 25 4925 1325 4190 590 4280 680 martin.gellerstedt@hv.se

Förutsättningar för teckentest Stickprov med lägst ordinaldata Test av median (om symmetri är median=väntevärde (populationsmedel) Inga antagandet om fördelningsform Mycket generellt test, men om det är normalfördelat är styrkan mycket lägre än t-test (ca 60% effektivitet vid normalfördlening). martin.gellerstedt@hv.se

Resultat=65 (13) p=0,041 Alltså signifikans! Ett stickprov men förutsättningarna för t-test ej uppfyllda: tecken-rang-test är ett annat alternativ Vikt Förväntat Differens Rang Tecken 3655 3600 55 3 + 3465 -135 5 - 3900 300 7 3410 -190 6 3720 120 4 4300 700 11 3570 -30 2 4000 400 8 3625 25 1 4925 1325 12 4190 590 9 4280 680 10 Wilcoxon tecken-rang-test Summera rangerna för värden med positivt tecken (eller negativt). Resultat=65 (13) p=0,041 Alltså signifikans! martin.gellerstedt@hv.se

Förutsättningar för tecken-rang-test Stickprov med kvantitativa data Fördelningen för differenserna ska vara symmetrisk (behöver dock ej vara normalfördelad) Test av median eller väntevärde (populationsmedelvärde) Ingen större effektivitetsförlust (ca 95% effektivitet givet normalfördelning) martin.gellerstedt@hv.se

Ett stickprov kvantitativa data, sammanfattande råd: t-test är att föredra. Fungerar om variabeln är normalfördelad eller stickprovet stort. Använd så ofta som möjligt. Ibland kan transformering göra datamaterialet mer lämpligt för t-test Teckentest är ett alternativ som fungerar oavsett fördelning Om fördelningen kan antas vara symmetrisk och stickprovet är under 20 kan tecken-rang-test vara ett bra alternativ martin.gellerstedt@hv.se

Två stickprov - ”parade observationer” Nollhypotes: d=0 Deskriptiv statistik: Konfidensintervall: Resultat: Parat t-test: Resultat: t=11,9 p<0,001 pre post diff martin.gellerstedt@hv.se

Två stickprov parade observationer- ej normalfördelat pre post diff rang Två alternativ: Teckentest: Alla differenser positiva p=0,001 Tecken-rang-test Rangsumman för plus=66 P=0,003 martin.gellerstedt@hv.se

Parade observationer kvantitativa data, sammanfattande råd: Parat t-test är att föredra. Fungerar om differenserna är normalfördelade eller stickprovet stort. Använd så ofta som möjligt. Ibland kan transformering göra datamaterialet mer lämpligt för t-test Teckentest är ett alternativ som fungerar oavsett fördelning Om fördelningen av differenserna kan antas vara symmetrisk och stickprovet är under 20 kan tecken-rang-test vara ett bra alternativ martin.gellerstedt@hv.se

Två oberoende stickprov Lean Obese Konfidensintervall Resultat: 2.23 1.18 (95%) Hypotestest, testfunktion: Resultat t=3.95 p=0,001 martin.gellerstedt@hv.se

Förutsättningar för t-test mellan två oberoende stickprov Kvantitativa data, två oberoende stickprov Om stickproven är små måste variabeln vara normalfördelad i respektive population (ju större stickprov desto större avvikelse kan accepteras) De två studerade populationerna ska vara lika homogena (samma standardavvikelse). Detta antagande är inte viktigt om stickproven är ungefär lika stora. Om villkoret ej är uppfyllt kan Welsh test användas martin.gellerstedt@hv.se

Två oberoende stickprov, men villkoren för t-test ej uppfyllda… Lean rank Obese rank Rangsummetest Jämför rangsummorna Resultat: 150 vs 103 p=0,001 martin.gellerstedt@hv.se

Förutsättningar för rangsummetest Två oberoende stickprov, lägst ordinaldata Vanligt antagande: Populationerna ska ha samma fördelning (spridning och form), men kan skilja sig i läge Tänkbara nollhypoteser: Populationerna har samma median Populationerna har samma väntevärde martin.gellerstedt@hv.se

Transformer... Vanligast är att logaritmera data. Transformen kan ge mindre skevhet samt mindre skillnader i varians. martin.gellerstedt@hv.se

Två oberoende stickprov kvantitativa data, sammanfattande råd: Oberoende t-test är att föredra. Fungerar om variabeln är normalfördelad i respektive population eller stickproven stora. Vidare ska populationerna vara lika homogena (ej väsentligt om stickproven är lika stora). Är populationerna inte lika homogena och stickproven olika stora (men i övrigt lämpliga för t-test) är Welsh test ett alternativ. Ibland kan transformering göra datamaterialet mer lämpligt för t-test Ett icke-parametriskt alternativ är rangsummetest martin.gellerstedt@hv.se

Kategoridata- ett stickprov Andelen lyckade försök=p Parameter= Om np(1-p)>5 gäller: z=1.96 ger 95% konfidensgrad Under samma villkor, testfunktion: martin.gellerstedt@hv.se

Två stickprov Om np(1-p)>5 i båda stickproven gäller: Under samma villkor; testfunktion (för att testa hypotesen att proportionerna är lika): martin.gellerstedt@hv.se

Analys av frekvenstabell (korstabell, kontingenstabell) Chi-två test Ex: Testfunktion: martin.gellerstedt@hv.se

martin.gellerstedt@hv.se

Analys av frekvenstabeller med parade data Efter kampanj Ekologisk Konventionell Före kampanj 22 4 18 46 Teckentest (eller McNemar) martin.gellerstedt@hv.se

Uppgift Vi vill undersöka om populationen ”bingolotto-tittare utan lott” skiljer sig vad det gäller genomsnittlig IQ Formalisera Vad är nollhypotesen? Vilken information behövs? martin.gellerstedt@hv.se

Stickprovsstorlek (Sample Size) Baserat på ett test Följande information behövs: Signifikansnivå (vanligen 5%) Styrka ( minst 80%) Variabilitet SD,SEM Skillnad att upptäcka (realistisk och intressant?) Baserat på konfidensintervall Följande information behövs: Konfidensgrad Variabilitet SD,SEM Önskad säkerhetsmarginal Baserat på test eller K.I.? Om inte all information finns? Styrkefunktionens utseende Länk: www.studysize.com martin.gellerstedt@hv.se