Egenskaper för punktskattning

Slides:



Advertisements
Liknande presentationer
Punkt- och intervallskattning Felmarginal
Advertisements

Inferens om en population Sid
PowerPoint av Bendik S. Søvegjarto Koncept, text och regler av Skage Hansen.
Talföljder formler och summor
PowerPoint av Bendik S. Søvegjarto Koncept, text och regler av Skage Hansen.
Hej hypotestest!. Bakgrund  Signifikansanalys  Signifikansprövning  Signifikanstest  Hypotesprövning  Hypotestest Kärt barn har många namn Inblandade:
Point Estimation Dan Hedlin
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
1 Exempel Man drar ett OSU om medlemmar ur en stor politiskt oberoende organisation, och frågar dels om kön, dels om politisk tillhörighet (vänster eller.
FL8 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
FL10 732G81 Linköpings universitet.
FL9 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
FL5 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Inferens om en ändlig population Sid
Jämförelse av två populationer Sid
Kapitel 5 Stickprovsteori Sid
Tentamensdags och lab 3…. Större program delas normalt upp i flera filer/moduler vilket har flera fördelar:  Programmets logiska struktur när man klumpar.
732G22 Grunder i statistisk metodik
FL2 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
F11 Olika urvalsmetoder, speciellt obundet slumpmässigt urval (OSU)
Kontinuerliga system: Differentialekvationer
Statistikens grunder, 15p dagtid
Tentamensdags och lab 3…. Större program delas normalt upp i flera filer/moduler vilket har flera fördelar:  Programmets logiska struktur när man klumpar.
Workshop i statistik för medicinska bibliotekarier!
Algebra och ekvationer
Kunskap 2 Egna upplevelser
Felkalkyl Ofta mäter man inte direkt den storhet som är den intressanta, utan en grundläggande variabel som sedan används för att beräkna det som man är.
Skattningens medelfel
Grundläggande programmering
Förelasning 6 Hypotesprövning
Föreläsning 81 Sampling och urval Ofta möter vi påståenden av typen “4.5 miljoner svenskar såg VM-finalen i fotboll”, “en svensk tolvåring väger i genomsnitt.
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
FL7 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Binomialsannolikheter ritas i ett stolpdiagram
Statistikens grunder 2 dagtid
Sannolikhet Stickprov Fördelningar
Simulering Introduktion Exempel: Antag att någon kastar tärning
Föreläsning 7 Fysikexperiment 5p Poissonfördelningen Poissonfördelningen är en sannolikhetsfördelning för diskreta variabler som är mycket.
Projekt 5.3 Gilpins och Ayalas θ-logistiska modell A Course in Mathematical Modeling - Mooney & Swift.
Linjär regression föreläsning 9
Normalfördelningen och centrala gränsvärdessatsen
F8 Hypotesprövning. Begrepp
F8 Hypotesprövning. Begrepp
Forskningsmetodik Sampling och urval Hypotesprövning Lektion 9
Fysikexperiment, 5p1 Random Walk 36 försök med Random walk med 1000 steg. Beräknad genomsnittlig räckvidd är  1000  32. Visualisering av utfallsrum.
732G22 Grunder i statistisk metodik
1 Fler uträkningar med normalfördelningstabell Låt X vara Nf(170,5). Beräkna Lösning:
Grundläggande statistik, ht 09, AN
Grundläggande statistik, ht 09, AN1 F6 Slumpmässigt urval 1. Population där X är diskret med fördelningen p(x). Medelvärdet μ och variansen σ². Observationer:
Forskningsmetodik lektion
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
1 Stokastiska variabler. 2 Variabler En variabel är en egenskap hos en individ /objekt. En variabel kan, som vi tidigare sett, vara kvalitativ eller kvantitativ.
SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ Timmar/
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
Medicinsk statistik II Läkarprogrammet T5 HT 2013 Susann Ullén FoU-centrum Skåne Skånes Universitetssjukhus.
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
Diskreta slumpvariabler. Stokastiskvariabel En slumpvariabel (stokastisk variabel) är en Funktion eller regel som tilldelar ett tal till varje Utfall.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
Idag: Repetition av Chi2-test Kap 6*, Kodning av svaren Kap 10*, Olika feltyper Kap 12*, Rapportskrivning *Dahmström.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov Data, observationer.
Samband & Inferens Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband mellan kvot-varibaler –Korrelationskoefficient.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
INFERENS OCH SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ.
Grundl. statistik F2, ht09, AN
Presentationens avskrift:

Egenskaper för punktskattning Vi vill skatta en okänd parameter, , i en modell, Exp(m), Po(m), etc. Tag ett stickprov x1, x2, …,xn Bilda en lämplig funktion av stickprovet kommer nu att vara en stokastisk variabel Önskvärda egenskaper för

Maximum likelihoodmetoden Låt x1, x2, …, xn vara ett stickprov på X1, X2, …, Xn där Def: kallas likelihoodfunktionen Def: Det Som maximerar L() kallas för ML skattningen av . maximera L() maximera ln L()

Hypotesprövning Skulle man kunna testa om Ahlgrens bilar skiljer sig åt på smak (färg)? Låt en person först prova ett antal bilar där personen får se färg, en inlärningsfas, sedan får personen ”gissa” vilken färg bilen har utan att se färgen. Om personen bara gissar borde personen få ungefär 1/3 rätta gissningar. Å andra sidan, om personen verkligen kan skilja på smak (färg), borde antalet rätta ”gissningar” vara fler än 1/3. Frågan är då, hur många fler rätta än 1/3 ska personen behöva för att man ska tro att personen inte bara gissar? Vi har ett litet dilemma här. Om personen bara gissar kommer gissningarna att vara, om vi betecknar antalet rätta med X, och antalet gissningar med n

Antag nu att vi låter en person, efter att personen har tränat, prova 15 bilar av olika färg. Om p=1/3, då ser sannolikhetsfunktionen för bin(15,1/3) ut som

Det vi ser är att det finns en positiv sannolikhet för alla utfall, 0:15, oavsett om personen gissar eller inte. k [0,] 0.00228366 1.00000000 [1,] 0.01712744 0.99771634 [2,] 0.05994603 0.98058890 [3,] 0.12988306 0.92064288 [4,] 0.19482460 0.79075981 [5,] 0.21430705 0.59593522 [6,] 0.17858921 0.38162816 [7,] 0.11480735 0.20303895 [8,] 0.05740368 0.08823160 [9,] 0.02232365 0.03082792 [10,] 0.00669710 0.00850427 [11,] 0.00152207 0.00180718 [12,] 0.00025368 0.00028511 [13,] 0.00002927 0.00003143 [14,] 0.00000209 0.00000216 [15,] 0.00000007 0.00000007

Här måste vi därför ta en risk och bestämma att för något utfall är sannolikheten att få detta om man bara skulle chansa så liten att vi bestämmer oss för att tro på personens förmåga istället. Det här brukar man beteckna med signifikansnivå, α. Vanliga nivåer på α brukar vara 0.05, 0.01, 0.001. I vårt fall skulle vi få, om α=0.05, k=9, dvs om personen tar rätt färg 9 gånger eller mer bestämmer vi oss för att personen är bättre än slumpen. Om vi valt α=0.01 skulle k=10 och personen skulle vara tvungen att ta rätt färg 10 gånger eller mer för att vi skulle tro att personen har förmågan.

När man formaliserar det här pratar man om nollhypotes H0 och mothypotes Ha. Vårt exempel skulle ge oss H0: p=1/3 Ha: p>1/3 med signifikansnivån α = P(förkasta H0 då H0 är sann) Ett annat vanligt begrepp man utnyttjar är p-värde. Def: P-värdet= P(att få det vi fått eller nåt ännu extremare under H0) Ex forts. Antag att vi observerat k = 8 rätta svar av 15. Då skulle p-värdet bli

Att jämföra med signifikansnivån som man bestämt sig för. Om man valt α=0.05 skulle man acceptera H0 eftersom p-värdet = 0.09 > α = 0.05 Vi gjorde n=374 försök och fick 133 rätta. Sätt upp hypoteser H0: p=1/3 Ha: p>1/3 Bestäm en signifikansnivå, α = 0.05 tex. Bestäm p-värdet för det resultat vi har: Jämför med signifikansnivån, och slutsatsen blir att vi accepterar H0

Alternativt, eftersom npq > 10 kan vi approximera med normalfördelningen. Då är vårt resultat Bestäm igen p-värdet = halvkorrektion och vi drar samma slutsats.

5%

Nästa steg är att tänka sig tvåsidiga mothypoteser Nästa steg är att tänka sig tvåsidiga mothypoteser. Antag att vi kastar ett mynt och vill avgöra om det är just, dvs om vi får lika många krona som klave. Det enda intressanta för oss är om myntet är korrekt. H0: p=1/2 Ha: p≠1/2 Antalet krona eller klave, X är nu bin(n, 1/2) under H0. Förkasta H0 för stora eller små värden på X Om vi normalapproximerar och standardiserar vår variabel är våra jämförelse- värden, med signifikansnivå α=0.05, -1.96 och 1.96. Förkasta H0 för värden som är större än 1.96 eller mindre än -1.96.

2.5% 2.5%