Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)

Slides:



Advertisements
Liknande presentationer
Punkt- och intervallskattning Felmarginal
Advertisements

Inferens om en population Sid
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
FL8 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
FL9 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
FL5 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
Inferens om en ändlig population Sid
Jämförelse av två populationer Sid
Kapitel 5 Stickprovsteori Sid
Skånes Universitetssjukhus
F11 Olika urvalsmetoder, speciellt obundet slumpmässigt urval (OSU)
Workshop i statistik för medicinska bibliotekarier!
Vad ingår kursen? i korta drag
Tillämpad statistik Naprapathögskolan
Stickprovsförfaranden
Skattningens medelfel
Experimentell utvärdering Språkteknologisk forskning och utveckling (HT 2006)
Förelasning 1 Kursintroduktion Statistiska undersökningar
Förelasning 6 Hypotesprövning
Centrala Gränsvärdessatsen:
Föreläsning 81 Sampling och urval Ofta möter vi påståenden av typen “4.5 miljoner svenskar såg VM-finalen i fotboll”, “en svensk tolvåring väger i genomsnitt.
732G81 Statistik Föreläsning 3 732G81 Statistik
FL7 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Binomialsannolikheter ritas i ett stolpdiagram
Statistik för internationella civilekonomer
Sannolikhet Stickprov Fördelningar
FL6 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Föreläsning 7 Fysikexperiment 5p Poissonfördelningen Poissonfördelningen är en sannolikhetsfördelning för diskreta variabler som är mycket.
Normalfördelningen och centrala gränsvärdessatsen
Forskningsmetodik Sampling och urval Hypotesprövning Lektion 9
Statistik Lars Valter Fil.lic. Statistik
Fysikexperiment, 5p1 Random Walk 36 försök med Random walk med 1000 steg. Beräknad genomsnittlig räckvidd är  1000  32. Visualisering av utfallsrum.
732G22 Grunder i statistisk metodik
VetU termin 4 moment 3 Analysera nivåer av kalium och kreatinin Mätningar genomförda på 120 män och 120 kvinnor (tidigare studenter KI) Dagens uppgift:
1 Fler uträkningar med normalfördelningstabell Låt X vara Nf(170,5). Beräkna Lösning:
Grundläggande statistik, ht 09, AN
Grundläggande statistik, ht 09, AN1 F6 Slumpmässigt urval 1. Population där X är diskret med fördelningen p(x). Medelvärdet μ och variansen σ². Observationer:
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
Medicinsk statistik Läkarprogrammet HT Medicinsk statistik Varför behöver Ni kunskap i medicinsk statistik? Självständigt arbete Kunna tolka resultat.
1 Normalfördelningsmodellen. 2 En modell är en förenklad beskrivning av någon del av verkligheten. Beskrivningen måste vara relevant för det vi skall.
Kostvetenskapliga Metoder 1. VAD ÄR STATISTIK? 2. DESKRIPTION 3. NORMALFÖRDELNING 4. HYPOTESPRÖVNING a) t-test b) ickeparametriska test c) chitvåtest.
SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ Timmar/
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
Medicinsk statistik II Läkarprogrammet T5 HT 2013 Susann Ullén FoU-centrum Skåne Skånes Universitetssjukhus.
Deskription + enkät Mätnivån styr hur man kan analysera data Tabeller – frekvenstabeller Diagram – cirkeldiagram, stapeldiagram, histogram, boxplot Beskrivande.
Vetenskaplig metod Statistik 1. VAD ÄR STATISTIK? 2. DESKRIPTION 3. URVAL 4. STATISTISK INFERENS OCH HYPOTESPRÖVNING a) t-test b) ickeparametriska test.
Deskription Normalfördelningsmodellen 1. 2 En modell är en förenklad beskrivning av någon del av verkligheten. Beskrivningen måste vara relevant för det.
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Föreläsning 4 732G81. Kapitel 4 Sannolikhetsfördelningar Sid
Vad är Statistik? Inom statistik teorin studeras -Hur vi samlar in data. -Hur data analyseras och vilka slutsatser som kan dras från data. -Hur insamlad.
Kostvetenskapliga Metoder 1. VAD ÄR STATISTIK? 2. DESKRIPTION 3. URVAL 4. STATISTISK INFERENS OCH HYPOTESPRÖVNING a) t-test b) ickeparametriska test c)
Betingade sannolikheter. 2 Antag att vi kastar en tärning och noterar antalet prickar som kommer upp. Låt A vara händelsen ”udda antal prickar”, dvs.
1. Kontinuerliga variabler
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
1 Numeriska Deskriptiva Tekniker. 2 Centralmått §Vanligtvis fokuserar vi vår uppmärksamhet på två typer av mått när vi beskriver en population: l Centraläge.
1 I. Statistiska undersökningar Ett gemensamt syfte för alla undersökningar är att få ökad kunskap om ett visst problemområde Det kanske viktigaste sättet.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
Sannolikhet och statistik Tabell Används för att ge en bra överblick av svaren man fått in, datan. Består av rader och kolumner. Frekvens Är hur många.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov Data, observationer.
Samband & Inferens Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband mellan kvot-varibaler –Korrelationskoefficient.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
INFERENS OCH SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ.
Kap 4 - Statistik.
Marknadsundersökning Kap 12
Förelasning 1 Kursintroduktion Statistiska undersökningar
Y 5.4 Tabeller och diagram Frekvens och relativ frekvens
Presentationens avskrift:

Statistisk inferensteori

Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval) till en population. Består av två huvuddelar: – Estimation – Hypotesprövning

Vid såväl estimation som hypotesprövning använder vi observationerna i stickprovet för att beräkna numeriska värden av olika slag som används för att uppskatta motsvarande värden i populationen. Vi använder t.ex. stickprovsmedelvärdet för att uppskatta populationsmedelvärdet.

population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer

Exempel: Descriptive Statistics: Resultat Variable N Mean StDev Minimum Q1 Median Q3 Maximum Range Resultat 10 25,90 8,95 14,00 18,75 23,50 35,50 39,00 25,00 10 personers tentamensresultat noterades till: 20, 25, 22, 35, 15, 14, 22, 30, 37, 39

population Population: Alla som skrev tentan (Antag att antalet är stort) Stickprov. Ur populationen valdes det slumpmässigt ut 10 personer INFERENS = Om man vet att medelvärdet i stickprovet är 25.9, hur bra är denna gissning av det sanna medelvärdet? De 10 personerna fick i medeltal 25.9 poäng på tentan Sanna medelvärdet (Okänt)

Numeriska värden som beräknas med hjälp av observationerna i ett stickprov kallas för statistikor. Exempel på statistikor: – Stickprovsmedelvärdet ( ) – Stickprovsstandardavvikelsen (s) – Stickprovsproportionen ( ) Eftersom att statistikans värde räknas ut med hjälp av stickprovet kommer detta värde att variera från stickprov till stickprov.

Samplingfördelningar Precis som vi gör för variationen i vår population kan vi använda oss av en fördelning för att beskriva statistikans variation från stickprov till stickprov Dessa fördelningar kallas samplingfördelningar. En samplingfördelning för en statistika talar om för oss vilka värden statistikan skulle anta vid upprepade stickprov av samma storlek från samma population

Fördelningen för stickprovsmedelvärdet ( ) Om vi tar stickprov från en normalfördelning är stickprovsmedelvärdet alltid normalfördelat oavsett stickprovsstorlek. Om vi tar stickprov från någon annan fördelning är stickprovsmedelvärdet approximativt normalfördelat om stickprovet är ”stort” (tumregel som fungerar i de flesta fall: Minst 30).

Stickprovsmedelvärdets medelvärde och standardavvikelse Låt n vara stickprovsstorleken och låt  och  vara medelvärdet och standardavvikelsen i den population vi tar stickprov ur. Då är Medelvärdet av alla möjliga stickprovsmedelvärden: Standardavvikelsen för stickprovsmedelvärdena:

Fördelning för stickprovsproportionen ( ) Proportion= Andel (t.ex. andelen kvinnor i en population) Populationen består av ettor och nollor (t.ex. om man är kvinna har man värdet 1, om man är man värdet 0) Räknar antalet ettor i populationen (eller stickprovet) och delar detta med det totala antalet Om stickprovet är stort kan vi hävda att stickprovsproportionen är approximativt normalfördelad.

Singlar ett viktat mynt (p=0,8) p= sannolikheten att få krona

När populationen består av ettor och nollor är populationens medelvärde p (populationsproportionen) och populationens standardavvikelse Detta ger: Medelvärdet av alla möjliga stickprovs- proportioner: Standardavvikelsen: Medelvärde och standardavvikelse för stickprovsproportionen

Konfidensintervall När man skattar en populationsparameter (t.ex. populationsmedelvärdet) med en statistika (t.ex. stickprovsmedelvärdet) är det svårt att ”träffa mitt i prick” Därför används s.k. konfidensintervall, dvs. ett intervall som täcker det sanna värdet i populationen med en viss säkerhet. Oftast gör man intervall med 95% eller 99% säkerhet.

Antag att vi med hjälp av ett stickprov bestående av 100 individer vill skatta genomsnittsintelligensen (mätt med ett IQ- test) i en population. Antag vidare att vi vet att standardavvikelsen i populationen är  =15.

Vi vet då följande: 1. Om vi tar upprepade stickprov bestående av n=100 individer kan stickprovsmedelvärdets variation mellan olika stickprov beskrivas av en normalfördelning med standardavvikelsen 2. I 95% av alla stickprov kommer stickprovsmedelvärdet att vara högst enheter ifrån populationsmedelvärdet.

I 95 % av alla stickprov kommer stickprovsmedelvärdet och populationsmedelvärdet att ligga inom två standardavvikelser från varandra Dvs. 95 % av alla stickprov ger ett stickprovsmedelvärde sådant att populationsmedelvärdet ligger inom intervallet: dvs. i vårt fall inom intervallet

Intervallet kallas för ett 95%-igt konfidensintervall för µ kallas för den statistiska felmarginalen.

Om vi t.ex. får = 97 så sträcker sig det 95%-iga konfidensintervallet från 94 till 100. Vi kan alltså med 95%-ig konfidens påstå att µ ligger mellan 94 och 100. Vi baserar detta på att vi använt en metod som ger oss rätt i 95% av fallen i det långa loppet. Observera att om vi gör många undersökningar och alltid beräknar 95%-iga konfidensintervall så kommer vi också att ”missa” µ i ca 5% av fallen i det långa loppet.

Konfidensintervall för en populationsproportion Antag att vi, med hjälp av ett stickprov bestående av n=3000 individer, vill skatta andelen i populationen som skulle rösta på socialdemokraterna om det vore val idag.

Vi vet följande: 1. Om vi tar upprepade stickprov bestående av n=3000 individer kan stickprovsproportionens variation mellan olika stickprov beskrivas av en normalfördelning med standardavvikelsen där p är populationsproportionen.

2. I 95% av fallen kommer stickprovsproportionen att vara högst ifrån p. 3. Ovanstående stämmer approximativt även om vi ersätter populationsproportionen med stickprovsproportionen, dvs. om vi använder

– Antag att 1200 av 3000 svarar att de skulle rösta på socialdemokraterna om det vore val idag. Vi får då – Det 95%-iga konfidensintervallet blir

– Felmarginalen är då 1.8 procentenheter. – Vi kan vara ganska säkra på att andelen i populationen ligger mellan 38.2 % och 41.8 %, eftersom vi använt en metod som, i det långa loppet, ger oss rätt i 95 % av fallen.