Presentation laddar. Vänta.

Presentation laddar. Vänta.

732G22 Grunder i statistisk metodik FL9. Populationsparametrar och skattningsfunktioner 2 Populationsparameter (okänd sanning) Skattningsfunktion (uppskattning.

Liknande presentationer


En presentation över ämnet: "732G22 Grunder i statistisk metodik FL9. Populationsparametrar och skattningsfunktioner 2 Populationsparameter (okänd sanning) Skattningsfunktion (uppskattning."— Presentationens avskrift:

1 732G22 Grunder i statistisk metodik FL9

2 Populationsparametrar och skattningsfunktioner 2 Populationsparameter (okänd sanning) Skattningsfunktion (uppskattning baserat på stickprov) Medelvärde Varians Standardavvikelse Proportionstal

3  Punktskattning = att använda skattningsfunktion som en uppskattning av populationsparameter  Dock: skattningsfunktioner är slumpvariabler och antar olika värden för varje stickprov. Hur ska vi hantera den osäkerheten?  Vi börjar med att göra tre antaganden: 1.stickprovet är draget som ett OSU 2.populationen som vi drog stickprovet ur är normalfördelad 3.populationsstandardavvikelsen σ är känd Är dessa antaganden rimliga? 3

4 Konfidensintervall för medelvärde Konfidensintervall = ett osäkerhetsintervall utlagt kring som tillåter oss att med en viss säkerhet säga att µ ingår i intervallet  Formel för konfidensintervall: 1.Beräkna 2.Beräkna 3.Hämta värdet på z ur normalfördelningstabell 4

5 Exempel Glödlampor som tillverkas i en viss fabrik har en lystid som kan betraktas som normalfördelad med medelvärde 1600 timmar och standardavvikelse 100 timmar. Nu har man bytt en maskin i fabriken, och har dragit ett stickprov om 150 lampor och konstaterat att bland dem var den genomsnittliga lystiden = 1618 timmar, medan standardavvikelsen förefaller oförändrad. Beräkna ett 95% konfidensintervall för lystiderna för lampor tillverkade med den nya maskinen! 5

6 Hur kan vi påverka bredden på ett konfidensintervall? 1.Öka n 2.Välj en annan konfidensnivå: Lägre konfidensnivå ger ett mindre tabellvärde och därmed ett smalare intervall, men samtidigt minskar säkerheten (exempelvis, 90% konfidensnivå innebär att vi bara med 90% säkerhet inkluderar det sanna populationsmedelvärdet (µ) i konfidensintervallet) 6

7 Den metod för att bilda konfidensintervall vi diskuterat hittills baseras alltså på de tre kraven 1.stickprovet måste vara draget som ett OSU 2.populationen som vi drog stickprovet ur är normalfördelad 3.populationsstandardavvikelsen σ är känd Är det rimligt att dessa krav uppfylls i praktiken? => Nej, åtminstone inte att σ är känd 7

8 Konfidensintervall när σ är okänd 8 Baserat på antagandena att 1.stickprovet måste vara draget som ett OSU 2.populationen som vi drog stickprovet ur är normalfördelad kan vi skatta σ med och beräkna konfidensintervallet som där t hämtas ur t-fördelningen

9 Exempel En viss sorts påsar med kryddor påstås innehålla 4 gram. Vi kontrollmäter fyra slumpmässigt utvalda påsar och erhåller Beräkna ett 95% konfidensintervall för genomsnittsivikten i påsarna!

10 Normalfördelning (z) och t-fördelning (t)  t-värdet är alltid större än z för att ta hänsyn till den ökade osäkerheten som följer av att konfidensintervallet baseras på två skattningar (både och s)  t-värdet konvergerar (går mot) z när n ökar (titta i t-tabellen!) 10

11 Konfidensintervall för π Exempel: Vid en undersökning bland 1000 personer dagen efter melodifestivalen svarade 536 att rätt låt vann. Beräkna ett 95-procentigt konfidensintervall för andelen av svenska befolkningen som anser att rätt låt vann! 11 Om np(1-p) > 5 kan vi beräkna

12 När ska vi använda vilken fördelning? 12 Typ av problemFördelning Medelvärde, σ kändNormalfördelning Medelvärde, σ okändt-fördelning Medelvärde, σ okänd, n > 30Normalfördelning AndelarNormalfördelning

13 Finns det någon skillnad i genomsnittlig bromssträcka mellan yngre och äldre bilförare? Beror skillnaden vi tycker oss se på slumpen, eller är den statistiskt säkerställd? Med andra ord: är populationerna Yngre respektive Äldre lika? Krav: 1.Vi har gjort två OSU och observationerna är oberoende av varandra 2.Populationerna som stickproven dragits ifrån kan betraktas som normalfördelade 13 YngreÄldre Bromssträcka (i meter)

14 Konfidensintervall för jämförelse av medelvärden i två populationer om stickproven är små (n 1 och n 2 < 30) där och t är t-tabellvärdet med n 1 + n 2 -2 frihetsgrader 14

15 Konfidensintervall för jämförelse av medelvärden i två populationer om stickproven är stora (n 1 och n 2 > 30) Exempel : En fabrik har två produktionslinjer som parallellt tillverkar samma produkt. Man vill undersöka om det finns några skillnader i produktivitet mellan de två linjerna och studerar därför antalet tillverkade produkter per produktionspass under 60 dagar, och följande beräknas: 15 LinjenMedelvärdeStandardavvikelse

16 Finns det någon skillnad i preferens för reklambroschyr? För att jämföra två reklambroschyrer, lät en reklamfirma trycka upp 1000 broschyrer enligt en metod och 1500 broschyrer enligt en annan. Broschyrerna delades ut till 2500 slumpmässigt valda personer och slumpen styrde också vem som fick vilken sorts broschyr. Av de 1000 broschyrerna blev 370 lästa, och av de 1500 blev 491 lästa. Finns det några skillnader i effektivitet (mätt som andel lästa) mellan de två broschyrerna? 16

17 Konfidensintervall för jämförelse av andelar i två populationer 17

18 Enkelsidiga konfidensintervall   > Punktskattning – tabellvärde * medelfel   < Punktskattning + tabellvärde * medelfel Exempel: Vid en anonym enkät bland ett stickprov om 100 förvärvsarbetande i en kommun uppger 16% av respondenterna att de sjukanmält sig fast de var friska fast för att slippa gå till jobbet. Beräkna ett enkelsidigt 95% konfidensintervall som ger en nedre gräns för andelen falskt sjukanmälda i kommunen. 18

19 Parvisa observationer När samma individ undersöks vid två olika tillfällen, till exempel före och efter en behandling, uppfylls inte kravet på oberoende mellan stickproven. Exempel: I en kurs i lästeknik får de 8 deltagarna vara med om två läshastighetstest, den ena före kursen och den andra efter. Har kursen gett något resultat? 19 Deltagare Före Efter


Ladda ner ppt "732G22 Grunder i statistisk metodik FL9. Populationsparametrar och skattningsfunktioner 2 Populationsparameter (okänd sanning) Skattningsfunktion (uppskattning."

Liknande presentationer


Google-annonser