Inferens om en population Sid

Slides:



Advertisements
Liknande presentationer
Punkt- och intervallskattning Felmarginal
Advertisements

Bedömning av uppfyllelse av miljökvalitetsnormer
Ett stickprov kvantitativa data: t-test
Hej hypotestest!. Bakgrund  Signifikansanalys  Signifikansprövning  Signifikanstest  Hypotesprövning  Hypotestest Kärt barn har många namn Inblandade:
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Samband mellan kvalitativa variabler Sid
1 Exempel Man drar ett OSU om medlemmar ur en stor politiskt oberoende organisation, och frågar dels om kön, dels om politisk tillhörighet (vänster eller.
FL8 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
FL10 732G81 Linköpings universitet.
FL9 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
FL5 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
Inferens om en ändlig population Sid
Jämförelse av två populationer Sid
Kapitel 5 Stickprovsteori Sid
Skånes Universitetssjukhus
732G22 Grunder i statistisk metodik
F11 Olika urvalsmetoder, speciellt obundet slumpmässigt urval (OSU)
Workshop i statistik för medicinska bibliotekarier!
Tillämpad statistik Naprapathögskolan
Stickprovsförfaranden
Skattningens medelfel
Experimentell utvärdering Språkteknologisk forskning och utveckling (HT 2006)
Förelasning 6 Hypotesprövning
Centrala Gränsvärdessatsen:
Föreläsning 81 Sampling och urval Ofta möter vi påståenden av typen “4.5 miljoner svenskar såg VM-finalen i fotboll”, “en svensk tolvåring väger i genomsnitt.
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
FL7 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Binomialsannolikheter ritas i ett stolpdiagram
Statistikens grunder 2 dagtid
Egenskaper för punktskattning
Sannolikhet Stickprov Fördelningar
FL6 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Linjär regression föreläsning 9
Normalfördelningen och centrala gränsvärdessatsen
Övningsexempel till Kapitel 7 Ex 1. BRÄNNBOLLSDILEMMAT ! En person funderar över hur man bäst uppskattar 28 meter. Av erfarenhet vet han att hans steglängd,
F8 Hypotesprövning. Begrepp
F8 Hypotesprövning. Begrepp
Forskningsmetodik Sampling och urval Hypotesprövning Lektion 9
Statistik Lars Valter Fil.lic. Statistik
732G22 Grunder i statistisk metodik
1 Fler uträkningar med normalfördelningstabell Låt X vara Nf(170,5). Beräkna Lösning:
Grundläggande statistik, ht 09, AN
Statistiska samband i trafikolyckor Av: Lina Forsberg Hangjin Lee Daniel Leo Carl-Mikael Westman.
Grundläggande statistik, ht 09, AN1 F6 Slumpmässigt urval 1. Population där X är diskret med fördelningen p(x). Medelvärdet μ och variansen σ². Observationer:
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
Föreläsning 8 732G81. Kapitel 8 Inferens om en ändlig population Sid
Kostvetenskapliga Metoder 1. VAD ÄR STATISTIK? 2. DESKRIPTION 3. NORMALFÖRDELNING 4. HYPOTESPRÖVNING a) t-test b) ickeparametriska test c) chitvåtest.
SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ Timmar/
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
Medicinsk statistik II Läkarprogrammet T5 HT 2013 Susann Ullén FoU-centrum Skåne Skånes Universitetssjukhus.
Föreläsning 6 732G81. Kapitel 6 Inferens om en population Sid
Vetenskaplig metod Statistik 1. VAD ÄR STATISTIK? 2. DESKRIPTION 3. URVAL 4. STATISTISK INFERENS OCH HYPOTESPRÖVNING a) t-test b) ickeparametriska test.
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Föreläsning 4 732G81. Kapitel 4 Sannolikhetsfördelningar Sid
Kostvetenskapliga Metoder 1. VAD ÄR STATISTIK? 2. DESKRIPTION 3. URVAL 4. STATISTISK INFERENS OCH HYPOTESPRÖVNING a) t-test b) ickeparametriska test c)
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
1. Kontinuerliga variabler
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
Hypotesprövning. Statistisk hypotesprövning och hypotetisk-deduktiv metod Hypotetisk-deduktiv metod: –Hypotes: Alla svanar är vita. –Empirisk konsekvens:
1 Multipel Regression Kapitel Modell Vi har p oberoende variabler som vi tänker oss kan vara relaterade till den beroende variabeln. Y ~ N( , 
Idag: Repetition av Chi2-test Kap 6*, Kodning av svaren Kap 10*, Olika feltyper Kap 12*, Rapportskrivning *Dahmström.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov Data, observationer.
Samband & Inferens Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband mellan kvot-varibaler –Korrelationskoefficient.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
INFERENS OCH SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ.
Presentationens avskrift:

Inferens om en population Sid 151-185 Kapitel 6 Inferens om en population Sid 151-185

Inferens om en population Dra slutsats från ett stickprov till en population Vi vet resultatet i stickprovet (exempelvis vad medelvärdet i stickprovet är). Vad kan vi säga om (exempelvis medelvärdet) i populationen? Två sätt att dra inferens från stickprov till population Konfidensintervall Hypotesprövning

Konfidensintervall Konfidensintervall Ett intervall runt en punktskattning Vi kan med en viss säkerhet säga att den okända parametern täcks av intervallet Konfidensgraden, 1 – a, bestäms ofta till 0.9, 0.95 eller 0.99

Konfidensintervall för populationsmedelvärde Krav OSU Samplingfördelningen för stickprovsmedelvärdet går att betrakta som normalfördelad Om  är känd fås ett dubbelsidigt konfidensintervall med konfidensgrad 1 - a: där z-värde hämtas från normalfördelningstabell (bilaga B) Om  är okänd fås ett dubbelsidigt konfidensintervall med konfidensgrad 1 - a: där t-värde hämtas från t-fördelningstabell (bilaga B) Tolkning: Med (1 – a)% säkerhet är populationsmedelvärdet mellan ….. och ….. Det som står efter +- kallas felmarginalen!

Enkelsidigt konfidensintervall Om vi bara vill bestämma EN gräns (övre eller nedre) så lägger vi all a i ena svansen av fördelningen Nedre gräns: Övre gräns: Tolkning: Med (1 – a)% säkerhet är det sanna medelvärdet högre än/lägre än …..

Exempel Ett gym erbjuder ett viktminskningsprogram. Ett OSU på 10 kunder visar följande viktminskning (i kg) efter genomgånget program: 6 3 5 8 0 2 1 7 3 2 Beräkna ett 95%-igt konfidensintervall för populationsmedelvärdet. Vilka antaganden måste göras vid beräkning av intervallet? Programansvarig påstår att folk minskar i vikt med minst 2 kg om man följer programmet. Kan vi med 95% säkerhet säga att den genomsnittliga minskningen är minst 2 kg?

Konfidensintervall för populationsandel Krav OSU np(1-p) > 5 Dubbelsidigt och enkelsidiga konfidensintervall med konfidensgrad 1 - a:

Exempel Enligt SIFOs senaste mätning svarade 976 av 1934 personer att de skulle rösta på någon av de rödgröna partierna (S, Mp, V) i riksdagsvalet om det var val i dag. Beräkna ett konfidensintervall (dubbelsidigt eller enkelsidigt?) så att du kan besvara frågan om minst en majoritet av svenska folket skulle rösta på någon av de rödgröna partierna om det var val i dag. Vilka antaganden behöver du göra för att beräkna intervallet?

Hypotesprövning Vi ställer upp två hypoteser Vi väljer signifikansnivå Nollhypotes: H0 Den hypotes vi inte tror på och vill kunna förkasta Nollhypotesen ska formuleras med ett likhetstecken Vi kan inte få statistiskt bevis/stöd för nollhypotesen Mothypotes: Ha Den hypotes vi vill ha statistiskt bevis/stöd för Om vi har tillräckligt med statistiskt bevis för att förkasta nollhypotesen kan vi tro på mothypotesen Mothypotesen ska formuleras med ett ”ej lika med” eller ”större än” eller ”mindre än” Hypoteserna grundar sig i hur frågeställningen ser ut och baseras ofta på tidigare resultat och (exempelvis ekonomisk) teori. Man formulerar INTE hypoteser baserat på hur resultaten från stickprovet ser ut! Vi väljer signifikansnivå α Risken att förkasta en sann nollhypotes Vanliga signifikansnivåer är 0.05, 0.01, 0.10

Hypotesprövning forts Vi väljer testvariabel Testvariabeln beräknas ofta som punktskattningen minus värdet under nollhypotesen, dividerat med medelfelet för skattningen Vi väljer om vi ska förkasta nollhypotesen och tro på mothypotesen Vi jämför testvariabelns värde med ett kritiskt värde från en tabell. Om testvariabeln faller inom det kritiska området kan nollhypotesen förkastas och vi har stöd för mothypotesen Vi drar slutsats Om nollhypotesen förkastas kan vi säga att vi har statistiskt stöd för mothypotesen och kan tro på den Ofta säger vi att vi har ”signifikans” eller att något är ”statistiskt säkerställt” Om nollhypotesen inte kan förkastas säger vi att vi INTE har statistiskt stöd för mothypotesen Vi drar slutsatsen på signifikansnivå α

Hypotesprövning för populationsmedelvärde Krav OSU Samplingfördelningen för stickprovsmedelvärdet går att betrakta som normalfördelad Nollhypotes H0: µ = µ0 Testvariabler Om  är känd Om  är okänd Kritiska värden För Ha: µ ≠ µ0 är kritiskt område både till vänster om zα/2 resp. tn-1;α/2 och till höger om z1-α/2 resp. tn-1;1-α/2 För Ha: µ < µ0 är kritiskt område till vänster om zα resp. tn-1;α För Ha: µ > µ0 är kritiskt område till höger om z1-α resp. tn-1;1-α

Exempel (forts.) Ett gym erbjuder ett viktminskningsprogram. Ett OSU på 10 kunder visar följande viktminskning (i kg) efter genomgånget program: 6 3 5 8 0 2 1 7 3 2 Hypotestesta på 5% signifikansnivå om den genomsnittliga viktminskningen i populationen är större än 2 kg. Vilka antaganden måste göras?

Hypotesprövning för populationsandel Krav OSU np(1-p) > 5 Nollhypotes H0: π = π0 Testvariabel Kritiska värden För Ha: π ≠ π0 är kritiskt område både till vänster om zα/2 och till höger om z1-α/2 För Ha: π < π0 är kritiskt område till vänster om zα För Ha: π > π0 är kritiskt område till höger om z1-α

Exempel Enligt Statistiska Centralbyråns senaste skattning var 8.5% arbetslösa i Sverige. Skattningen beräknades på ett slumpmässigt urval av 29500 personer. Hypotestesta på 1% signifikansnivå om arbetslösheten i Sverige är lägre än 9%. Vilka antaganden behöver du göra?

Hypotesprövning med p-värde p-värde = sannolikheten att vår testvariabel ska anta det värde som vi har observerat eller ännu mer extremt om nollhypotesen är sann Med hjälp av normalfödelningstabellen kan vi ta reda på denna sannolikhet Om p-värdet är litet (mindre än a) är det osannolikt att vi skulle fått det resultat vi fick på testvariabeln om nollhypotesen är sann. Vi förkastar nollhypotesen.

Exempel En viss amerikansk bank tror att det genomsnittliga uttaget från bankomater är $150 och standardavvikelsen är $50. Finns det statistisk stöd för att banken har fel, om ett OSU av 36 uttag ger ett medelvärde på $160? Genomför ett hypotestest med hjälp av p-värdesmetoden på 5% signifikansnivå. Vilka antaganden behöver du göra? Vad skulle p-värdet bli om vi i stället gjorde ett enkelsidigt test, och vi ville testa om det finns statistiskt stöd för att genomsnittet är högre än $150? Vad skulle p-värdet bli om vi i stället gjorde ett enkelsidigt test, och vi ville testa om det finns statistiskt stöd för att genomsnittet är lägre än $150?

Relation mellan konfidensintervall och hypotesprövning Om värdet i nollhypotesen ingår i ett konfidensintervall med konfidensgrad 1-a kan vi inte förkasta nollhypotesen på signifikansnivå a Om värdet i nollhypotesen inte ingår i ett konfidensintervall med konfidensgrad 1-a kan vi förkasta nollhypotesen på signifikansnivå a Vid dubbelsidiga mothypoteser krävs dubbelsidiga intervall och vid enkelsidiga mothypoteser krävs enkelsidiga intervall

Exempel (forts) Enligt SIFOs senaste mätning svarade 976 av 1934 personer att de skulle rösta på någon av de rödgröna partierna (S, Mp, V) i riksdagsvalet om det var val i dag. Beräkna ett konfidensintervall så att du kan hypotestesta på 10% signifikansnivå om minst en majoritet av svenska folket skulle rösta på någon av de rödgröna partierna om det var val i dag.

Feltyper och styrka Feltyper Styrka Typ I-fel: Att förkasta en sann nollhypotes Sannolikhet för Typ I-fel: a Typ II-fel: Att inte förkasta en falsk nollhypotes Sannolikhet för Typ II-fel: b Styrka Sannolikheten att förkasta en falsk nollhypotes