Presentation laddar. Vänta.

Presentation laddar. Vänta.

1 I. Statistiska undersökningar Ett gemensamt syfte för alla undersökningar är att få ökad kunskap om ett visst problemområde Det kanske viktigaste sättet.

Liknande presentationer


En presentation över ämnet: "1 I. Statistiska undersökningar Ett gemensamt syfte för alla undersökningar är att få ökad kunskap om ett visst problemområde Det kanske viktigaste sättet."— Presentationens avskrift:

1 1 I. Statistiska undersökningar Ett gemensamt syfte för alla undersökningar är att få ökad kunskap om ett visst problemområde Det kanske viktigaste sättet att skaffa sig sådan kunskap är genom observationer Inom statistikteorin studeras –hur observationer samlas in –hur observationer analyseras –hur slutsatser kan dras från observationer

2 2 Deskriptiva och analytiska undersökningar Vid en deskriptiv eller beskrivande undersökning försöker man att, med hjälp av ett insamlat datamaterial, beskriva ett förhållande eller ett faktiskt händelseförlopp.

3 3 Vid en analytisk eller förklarande undersökning försöker man klarlägga orsakssamband och förklara varför verkligheten ser ut som den gör.

4 4 En statistisk undersöknings olika steg Problemformulering Planering Datainsamling Analys Rapportering

5 5 Planering av en undersökning Vid planering bestämmer man sig bl.a. för: –Vilka data som skall samlas in –Hur dessa data skall samlas in, dvs. val av datainsamlingsmetod Totalundersökning eller urvalsundersökning Typ av urval vid urvalsundersökning Val av mätmetod och mätinstrument. –Hur eventuellt bortfall skall hanteras –Hur data skall analyseras –Hur resultatet skall redovisas

6 6 II. Databildning

7 7 Introduktion Den process som har till uppgift att producera de data som kunskapsbildningen behöver kallar vi databildning

8 8 Datainsamlingen måste var anpassad till den teori man har om problemområdet Teorier om dataanalys påverkar mätinstrumentets utformning och konstruktion

9 9 Experimentella och icke- experimentella undersökningar Experimentella undersökningar: –Behandling. Försöksenheterna utsätts för vissa behandlingar i avsikt att studera effekten av dessa behandlingar –Upprepbarhet. Experimentet kan upprepas ett önskat antal gånger –Randomisering. Försöksenheterna fördelas slumpmässigt på olika behandlingar

10 10 –Kontroll. Försöksbetingelserna kan i allmänhet kontrolleras och konstanthållas, eller åtminstone löpande registreras. –Dubbelblinda försök. Då försöksenheterna är människor vet i regel varken försökspersonen eller den som ger behandlingen vilken behandling försökspersonen får.

11 11 Ickeexperimentella undersökningar, observationsundersökningar. –Undersökningsenheter eller händelseförlopp påverkas ej på något sätt. –Behandlingarna i den experimentella studien ersätts av passivt observerande.

12 12 Experimentella studier I regel att föredra om man vill undersöka effekten av någon förklaringsvariabel på någon responsvariabel, eftersom det med en icke-experimentell ansats kan vara svårt att särskilja effekten av förklaringsvariabeln från effekter av andra faktorer

13 13 Randomisering Randomisering innebär att slumpen avgör vilken behandling en undersökningsenhet tilldelas Genom randomisering undviks systematiska fel Randomisering medför att effekten av en eventuell behandling med hög grad av säkerhet och precision kan fastställas med hjälp av statistikteori

14 14 Generaliserbarhet Ett problem vid experimentella studier är att undersökningsenheterna inte alltid är slumpmässigt utvalda ur någon väldefinierad population och att därför de resultat som erhålls, i strikt mening, endast gäller för de som ingår i försöket I sådana fall måste generaliseringar utöver undersökningsenheterna bygga på icke-statistiska argument

15 15 Brist på realism Försöken utförs ibland i en miljö som ej är verklig. Detta innebär också ett generaliseringsproblem. Det är inte säkert att en individ reagerar likadant i ett laboratorium som i ”verkligheten”.

16 16 Urvalsundersökningar Varför urvalsundersökning i stället för totalundersökning? –Billigare –Snabbare –Bättre mätning –Praktiskt omöjligt med totalundersökning då populationen är mycket stor eller oändlig –Förstörande prov

17 17 Olika typer av urval Lättåtkomliga element Frivilliga svar Frivilliga försökspersoner Sannolikhetsurval

18 18 Sannolikhetsurval Urvalsenheterna väljs med hjälp av någon slumpmekanism För varje enhet är sannolikheten för att inkluderas i urvalet känd

19 19 Med sannolikhetsurval kan man... ge objektiva mått på undersökningsresultatens precision utforma en teori för effektiv undersökningsplanering på förhand göra objektiva jämförelser mellan olika urvalsplaner på förhand uppskatta erforderliga urvalsstorlekar för att uppnå önskad precision

20 20 Olika typer av sannolikhetsurval Obundet slumpmässigt urval (OSU) Stratifierat urval Klusterurval

21 21 Obundet slumpmässigt urval Vid varje dragning av en enhet har de i populationen kvarvarande enheterna samma sannolikhet att bli valda Vid OSU av n enheter har alla möjliga kombinationer av n enheter samma chans att bli valda

22 22 Stratifierat urval Populationen delas in i strata och ett OSU dras ur varje stratum Skäl: –Om resultatet skall redovisas för varje stratum kan urvalsstorlekarna för varje stratum avpassas så att vissa precisionskrav uppfylles utan att man erhåller överflödiga observationer från vissa strata

23 23 –Skattningar av populationsparametrar (t.ex. populationsmedelvärdet) kan göras med bättre precision än vid ett OSU, om bara stratifieringsvariabeln är ”bra” (homogent inom strata, heterogent mellan strata)

24 24 Gruppurval (klusterurval) Populationen delas in i grupper (kluster) av enheter. Ett antal sådan kluster väljs slumpmässigt. Samtliga enheter inom ett kluster undersöks. Skäl: –Ramproblem –Geografisk spridning –Kostnader

25 25 Mätning En tilldelning av tal till undersökningsenheterna på ett sådant sätt att vissa relationer mellan enheterna, med avseende på någon egenskap, avspeglas i relationer mellan talen

26 26 Mätnivåer (skalnivåer) Nominal –Endast klassificering Ordinal –Klassificering och rangordning Intervall –Klassificering, rangordning och ekvidistans Kvot –Klassificering, rangordning, ekvidistans och absolut nollpunkt

27 27 Observera att mätnivån bestäms av vilken typ av information mätningen ger oss. Mätnivån har bl.a. betydelse för vilken typ av beräkningar som är meningsfulla

28 28 Operationalisering Operationalisering av en variabel innebär en beskrivning av hur man skall gå tillväga, vilka operationer man måste utföra, för att kunna göra mätningen. Operationalisering innebär således att mätregler definieras.

29 29 Indikatorer och latenta variabler En latent variabel är en egenskap som ej är direkt observerbar En indikator är en observerbar (manifest) variabel som används vid mätning av en latent variabel

30 30 Reliabilitet Grad av överensstämmelse mellan upprepade mätningar med samma mätinstrument på samma undersökningsenhet.

31 31 Validitet ”Mätinstrumentet mäter vad det avser att mäta” ”Överensstämmelse mellan teoretisk och operationell definition” ”Frånvaro av systematiska mätfel”

32 32 Några felkällor Täckningsfel –Övertäckning Urvalsramen innehåller individer som ej finns med i målpopulationen –Undertäckning Urvalsramen saknar individer som finns med i målpopulationen –Kan ge upphov till systematiska fel (bias)

33 33 Bortfallsfel –Individbortfall innebär att man från en eller flera individer ej får något svar på t.ex. en postenkät –Partiellt bortfall innebär svarsvägran på vissa frågor –Kan ge stora systematiska fel

34 34 Mätfel –Mätfel som beror på respondenten Respondenten kan vara okunnig om det sanna värdet Glömska. En del händelser kommer man inte ihåg. Andra kommer man ihåg men placerar fel i tiden. Känsliga frågor. Det kan vara svårt att få korrekta svar på frågor om sådant som konsumtion av droger, respondentens sexliv, etc. Prestigeladdade frågor. Exempel på denna typ av frågor är frågor om hur mycket man konsumerar av olika slag av ”finkultur”. Leder till s.k. prestigebias. Egenintresse. Ibland kan det ligga i respondentens intresse att svara på ett visst sätt eftersom man vet att resultatet av undersökningen kan leda till att t.ex. politiker eller andra beslutsfattare agerar på ett för respondenten önskvärt sätt.

35 35 –Mätfel som beror på intervjuaren Exempelvis så kan intervjuarens uppträdande påverka resultatet (intervjuareffekt). –Mätfel som beror på mätmetoden Olika mätmetoder (besöksintervju, telefonintervju, postenkät, etc) kan ge olika resultat. Exempelvis så ger ofta postenkäter sannare svar på känsliga frågor. –Mätfel som beror på frågeformuläret Oklara frågeformuleringar och definitioner, dåliga anvisningar, etc. kan ge upphov till stora systematiska fel. Även antalet frågor kan ha betydelse för kvaliteten på de data man får. Enkäter som tar lång tid att fylla i leder t.ex. i regel till större bortfall.

36 36 Bearbetningsfel Kodningsfel Inmatningsfel Datorbearbetningsfel

37 37 Urvalsfel Uppstår när man studerar ett urval i stället för hela populationen Slumpmässigt och möjligt att uppskatta om urvalet görs ”korrekt”

38 38 III. Deskription

39 39 Tabeller Tabell- och kolumnrubriker bör vara fullständiga men ändå kortfattade Lämplig uppställning: –Tabellnr., rubrik –Kort anmärkning som gäller hela tabellen –Tabell –Noter –Längre anmärkningar –Källhänvisning

40 40 Ange enheten för respektive kolumn ovanför varje kolumn. Om samma enhet gäller för hela tabellen ges den i rubriken.

41 41 Tabell, en variabel Envägsindelad frekvenstabell –Innehåller en variabel samt absoluta eller relativa frekvenser

42 42 Tabell x.?? Studenternas fördelning på variabeln nivå på utbildning vid påbörjade högskolestudier. År 2003. Procent.

43 43 Tvåvägsindelad frekvenstabell –Innehåller två variabler samt frekvenser eller relativa frekvenser Envägsindelad kvottabell –Innehåller två variabler, men en av variablerna finns i tabellcellerna i form av t.ex. medelvärden. Tabell, två variabler

44 44 Tabell x.?? Studenternas fördelning på variabeln nivå på utbildning vid påbörjade högskolestudier. År 2003. Uppdelat på kön. Procent.

45 45 Envägsindelad kvottabell: Genomsnittspoäng för män och kvinnor

46 46 Tre variabler –Trevägsindelad frekvenstabell –Tvåvägsindelad kvottabell Fyra variabler –Fyrvägsindelad frekvenstabell –Trevägsindelad kvottabell Tabell, tre eller fyra variabler

47 47 Diagram Diagramrubriken bör vara fullständig men ändå kortfattad Lämplig uppställning: –Diagramnr., rubrik –Kort anmärkning som gäller hela diagrammet –Diagram –Noter –Längre anmärkningar –Källhänvisning

48 48 Välj diagramtyp som passar det aktuella problemet Välj lämpliga skalor för axlarna Stympa ej y-axeln i onödan. Om y-axeln stympas bör detta klart anges

49 49 För axlarna skall man tydligt ange variabler, enheter, skalsteg och skalvärden Diagrammet kan med fördel omges av en ram och innehålla stödlinjer

50 50 Kvalitativa variabler För att visa en fördelning, i en population eller ett urval, när man har en kvalitativ variabel, kan man t.ex. använda ett stapeldiagram eller ett cirkeldiagram.

51 51 Stapeldiagram, en variabel. Absoluta frekvenser.

52 52 Stapeldiagram, en variabel. Relativa frekvenser.

53 53 Liggande stapeldiagram

54 54 Cirkeldiagram

55 55 Fotbollsspelarens rörelsemönster

56 56 Kvantitativa variabler När man har en kvantitativ variabel kan man t.ex. använda histogram eller ett stam- bladdiagram. Man kan även klassindela materialet och presentera det med hjälp av ett stapeldiagram.

57 57 Histogram. Nyfödda barns fördelning på variabeln längd

58 58 Histogram. Åldersfördelning för ett urval av högskoleprovtagare.

59 59 Stapeldiagram. Åldersfördelning för samtliga högskoleprovtagare våren 1987.

60 60 Stapeldiagram, två variabler

61 61 Stam-bladdiagram. Chefernas fördelning på anställningstid. Anställningstid Stem-and-Leaf Plot Frequency Stem & Leaf 4,00 0. 2344 6,00 0. 567889 7,00 1. 0222233 8,00 1. 56788899 9,00 2. 111123344 5,00 2. 56679 2,00 3. 34 Stem width: 10,00 Each leaf: 1 case(s)

62 62 Tidsseriedata Tidsserier presenteras ofta med hjälp av s.k. linjediagram I linjediagram kan man ofta upptäcka sådant som trender, cykler eller säsongsvariationer.

63 63 Privat konsumtion i USA

64 64 Försäljning, kvartalsdata

65 65 Pulsmätning

66 66 Beskrivande mått Om man vill beskriva en egenskaps fördelning i en population eller ett sampel kan man naturligtvis göra detta genom att räkna upp samtliga observationer.

67 67 I en frekvenstabell sammanfattas en fördelning i ett fåtal värden - frekvenserna. Med hjälp av beskrivande mått sammanfattas fördelningen av ett eller ett fåtal tal.

68 68 Centralmått och kvartiler Genom att beräkna kvartiler sammanfattas en fördelning i tre tal: –första kvartilen –andra kvartilen (medianen) –tredje kvartilen

69 69 Lägger vi till det minsta och det största värdet kan vi beskriva fördelningen med hjälp av fem tal. (Five number summary) En boxplot (ett lådagram) är ett diagram som bygger på denna five number summary.

70 70 Boxplot (lådagram), ORD- provet.

71 71 Box-plot (lådagram), NOG- provet

72 72 Genom att beräkna ett centralmått sammanfattas fördelningen i ett tal. Tre vanliga centralmått: –Typvärdet –Medianen –Medelvärdet

73 73 Typvärdet... –är det mest frekventa värdet Medianen… –är, om antalet mätvärden är udda, det mittersta av de rangordnade mätvärdena. Om antalet mätvärden är jämnt är medianen medelvärdet av de två mittersta mätvärdena. Medelvärdet… –är summan av alla mätvärden dividerat med antalet mätvärden.

74 74 Vilket av dessa tre mått skall vi använda? Detta beror framför allt på två saker: –Syfte. Vad skall vi ha måttet till? –Möjlighet att tolka resultatet. Antag att vi sätter gul=1, blå=2 och röd=3. Eftersom vi har siffror kan vi beräkna typvärde, median och medelvärde. Men hur tolkar vi t.ex. medelvärdet 2,3 eller medianen 2? Medianen ”kräver” rangordning, att 2 innebär mer av egenskapen än 1. Medelvärdet ”kräver” dessutom ”ekvidistan”, dvs. lika avstånd mellan skalstreck.

75 75 Spridningsmått Ett centralmått sammanfattar en fördelning i ett enda tal och ger information om var fördelningens ”centrum” är beläget. Ett spridningsmått ger information om fördelningens spridning.

76 76 Tre olika spridningsmått Variationsvidden är skillnaden mellan det största och det minsta värdet Kvartilavståndet är avståndet mellan första och tredje kvartilen. Måttet anger alltså inom vilket avstånd de 50% mittersta observationerna ligger. Standardavvikelsen är ett spridningsmått som beskriver hur mycket mätvärdena avviker från medelvärdet.

77 77 Modeller Vi har alla stött på modeller i olika sammanhang. Ex: –Leksaksbilar –Modelljärnvägar –Dockskåp

78 78 En leksaksbil är i vissa avseenden en kopia av en ”riktig” bil. Men den skiljer sig också ifrån en riktig bil på vissa punkter: –i regel inte lika stor –dörrarna kanske inte kan öppnas –motor kanske saknas –osv

79 79 Leksaksbilen kan sägas vara en förenkling av en riktig bil, men måste ändå vara tillräckligt ”naturtrogen” på just de punkter som krävs för att vi skall kunna använda den på önskat sätt

80 80 En modell är en förenklad beskrivning av någon del av verkligheten. Beskrivningen måste vara relevant för det vi skall använda modellen till.

81 81 Ytterligare exempel Kartor är modeller av den geografiska verkligheten. Vad som finns med på en karta beror på användningsområde. Vi har t.ex. –vägkartor –ekonomiska kartor –topografiska kartor –sjökort

82 82 Flygplansmodell i vindtunnel En cirkel som en modell för ett runt bord för att t.ex. beräkna bordets yta Tiden = sträckan / hastigheten Efterfrågefunktion:

83 83 Vetenskapliga modeller Modellen utformas så att den baserar sig på och sammanfattar vår teoretiska kunskap om verklighetsområdet Modellen består av ett antal teoretiska begrepp och en beskrivning av hur dessa begrepp är relaterade till varandra

84 84 Sannolikhetsmodeller Det typiska för statistiker är att de arbetar med modeller av slumpmässiga försök Modeller av slumpmässiga försök kallas för sannolikhetsmodeller eller statistiska modeller

85 85 IV Sannolikhetsmodeller

86 86 Slumpmässiga försök Ett försök som, vid upprepning under samma betingelser, ger resultat som varierar från gång till gång kallas för ett slumpmässigt försök –Exempel: Upprepade kast med en ”normal” tärning Fylla på mjöl i tvåkilosförpackningar Välja en individ slumpmässigt och fråga vad individen tycker om en produkt

87 87 Sannolikhetsmodellens byggstenar En sannolikhetsmodell består av –Ett utfallsrum som är mängden av alla möjliga resultat (utfall) som försöket kan ge –Sannolikheter som anger hur ”troligt” det är att de olika utfallen inträffar

88 88 Exempel på sannolikhetsmodeller Försök: Kasta ett mynt och se om det blir krona eller klave. Modell 1: S={kr, kl} P(kr)=P(kl)=0.5 Modell 2:S={kr, kl} P(kr)=0.75, P(kl)=0.25

89 89 Händelser En händelse är en delmängd av utfallsrummet

90 90 Exempel Försök: Kasta en ”vanlig” sexsidig tärning och notera antalet prickar som kommer upp. Utfallsrum:S={1, 2, 3, 4, 5, 6}, där siffrorna representerar utfall (elementarhändelser, simple events).

91 91 Låt A vara händelsen att vi får ett udda antal prickar A={1, 3, 5} Låt B vara händelsen att antalet prickar är mindre än fyra B={1, 2, 3}

92 92 Unioner Låt C vara händelsen att A och/eller B inträffar C=A 

93 93 Snitt Låt D vara händelsen att A och B inträffar D=A  B={1, 3}

94 94 Komplement Komplementhändelsen till en händelse är mängden av samtliga utfall (elementära händelser) i utfallsrummet, som innebär att händelsen ej inträffar

95 95 Ömsesidigt uteslutande Låt F vara händelsen att vi får fyra eller fem prickar F={4, 5} Vi ser nu att B  F= , dvs. den tomma mängden Händelserna B och F sägs vara ömsesidigt uteslutande eftersom de ej kan inträffa samtidigt

96 96 Kolmogorovs axiom Vi såg tidigare att en modell av ett slumpmässigt, förutom ett utfallsrum, även består av mått på hur troliga de olika utfallen i utfallsrummet är. Dessa mått kallar vi för sannolikheter. Följande ”egenskaper” hos sannolikheter kallas för Kolmogorovs axiom:

97 97 Axiom 1 För varje händelse A gäller att sannolikheten för händelsen är mellan noll och ett (med gränserna inkluderade)

98 98 Axiom 2 För hela utfallsrummet S gäller att P(S)=1 dvs summan av alla sannolikheter i utfallsrummet är ett.

99 99 Axiom 3 Om A och B är ömsesidigt uteslutande händelser gäller att

100 100 Dessa tre axiom utgör grunden för hela sannolikhetsteorin Från axiomen kan vi t.ex. härleda följande viktiga satser:

101 101 Sannolikhetslärans additionssats

102 102 Sannolikhetstolkningar Sannolikhetsteorin är en del av matematiken och från en matematisk synvinkel är det kanske inte så intressant att grubbla över vad sannolikhet är. Om sannolikhetsmodellen skall användas för att lösa ett problem i ”verkligheten” måste man emellertid intressera sig för kopplingen mellan den abstrakta modellen och den konkreta verkligheten.

103 103 När man med hjälp av sannolikhetsmodeller försöker lösa problem i verkligheten uppstår bl.a. följande problem: –Hur skall sannolikheterna tolkas? –Hur skall sannolikheterna bestämmas?

104 104 Tolkning av sannolikheter Vi skall titta på två olika angreppssätt när det gäller tolkning av sannolikheter: –Objektiv tolkning, där sannolikheten antas existera i ”naturen” oberoende av vår grad av personlig tilltro. –Subjektiv tolkning, där sannolikheten är en grad av personlig tilltro.

105 105 Objektiv tolkning Antag att vi kastar en tärning ett stort antal gånger och efter varje gång beräknar den relativa frekvensen sexor. Vi kommer då att se att den relativa frekvensen så småningom stabiliseras. Vi skulle kunna tolka sannolikheten för ”sexa” som gränsvärdet för den relativa frekvensen då antalet kast går mot oändligheten. Detta stämmer säkert väl överens med vad många menar med sannolikhet, men ställer till vissa matematiska problem om det används som en definition av begreppet sannolikhet.

106 106 Den (vaga) frekvenstolkningen innebär att sannolikhet tolkas som det tal som den relativa frekvensen går mot då antalet försök går mot oändligheten. Om sannolikheten för ”sexa” i modellen är 1/6, så betyder det i empiriska termer: ”Om vi låter antalet kast gå mot oändligheten så kommer den relativa frekvensen ”sexa” att gå mot 1/6”

107 107 Man skulle också kunna tänka sig att betrakta sannolikhet som en egenskap hos tinget. Precis som en tärning har en vikt så har den också en benägenhet att hamna på ”sexa” när man kastar den. Denna benägenhet kan tänkas manifestera sig i att relativa frekvensen, när man kastar tärningen väldigt många gånger, tenderar att bli nära den sanna sannolikheten.

108 108 Observera att så länge vi rör oss med objektiva tolkningar så är påståenden av typen ”sannolikheten för ”sexa” är 1/6” ett uttalande om ”naturen”. Vi tänker oss att sannolikheten faktiskt existerar oberoende av oss. Vi kan då också tänka oss att t.ex. på något sätt försöka uppskatta eller testa en hypotes om denna sannolikhet.

109 109 Subjektiv tolkning Sannolikhet är ett mått på vår egen grad av tro på olika utfall. Om sannolikheten för ”sexa” i vår modell är 1/6, så betyder det bara att det är min grad av tilltro till att det blir en ”sexa” när jag kastar tärningen.

110 110 Observera att med en subjektiv tolkning är påståendet ”sannolikheten för ”sexa” är 1/6” inte ett påstående om ”naturen” utan ett påstående om vad jag tror om naturen. Påståendet kan därmed inte heller vara falskt (förutsatt att man inte medvetet eller omedvetet ljuger). Här blir en skattning eller hypotesprövning om någon sann verklig sannolikhet meningslös eftersom sannolikhet inte är något som finns i verkligheten utan något som finns hos oss.

111 111 Skillnader mellan sannolikhetstolkningar Objektiv: –Sannolikheten är bestämd av hur verkligheten och det slumpmässiga försöket ser ut och oberoende av vad vi tror och inte tror. Subjektiv: –Sannolikheten för en viss händelse bestäms av individens tro och kan variera mellan olika individer och också för samma individ mellan upprepningar av försöket.

112 112 Objektiv: –Sannolikhet är ett mått på ”osäkerhet” i ”naturen”. Subjektiv: –Sannolikhet är ett mått på individens osäkerhet.

113 113 Objektiv: –Eftersom vi tänker oss sannolikhet som något som existerar i verkligheten så är den angivna sannolikheten í modellen sann eller falsk. Subjektiv: –Det finns ingen objektivt sann sannolikhet. Sannolikhet är ju kopplad till individen och var och en har sin egen personliga grad av tilltro

114 114 Objektiv: –Sannolikhetsmodellen är en modell av ”naturen” och variationer och möjligheter i ”naturen” Subjektiv: –Sannolikhetsmodellen är en modell av min egen osäkerhet om hur ”naturen” ser ut.

115 115 Antag att vi kastar en tärning, men att tärningen hamnar under ett bord, så att vi inte kan se vad utfallet blev. Som objektivister är det nu meningslöst att uttala sig om sannolikheten för t.ex. ”sexa”, eftersom försöket redan utförts och det inte längre existerar någon ”osäkerhet” i ”naturen”. Antingen är det en ”sexa” eller också är det inte en ”sexa”. Som subjektivister kan vi göra ett sannolikhetsuttalande eftersom vår modell inte är en modell av ”naturen” utan en modell av vår tro om ”naturen” och vi är fortfarande osäkra eftersom vi inte kan se tärningen. (Vi modellerar ”vår tankevärld” i stället för en objektivt existerande ”verklighet”).

116 116 Som objektivister är det meningslöst att uttala sig om sannolikheten att Gud finns. I ”naturen” finns ingen osäkerhet. Antingen finns Gud eller också finns han/hon/det inte. Som subjektivister kan vi göra ett sådant uttalande eftersom sannolikheten bara skall uttrycka graden av vår egen personliga tro.

117 117 Bestämning av sannolikheter Bestämning av sannolikheter är ett helt annat problem än tolkning av sannolikheter. Ibland blandas dessa två saker ihop. Även som objektivist kan man bestämma sannolikheterna subjektivt, i meningen att man sätter en sannolikhet som man tror på. Poängen är att som objektivist är denna sannolikhet ett påstående om ”naturen” som kan vara rätt eller fel. Är man subjektivist är sannolikheten inte ett påstående om naturen utan graden av tro är själva sannolikheten.

118 118 Observera att det inte finns något enda korrekt sätt att bestämma en sannolikhet. Som subjektivister är vi ute efter att formulera en modell av vår osäkerhet om hur verkligheten ser ut. Sannolikheterna i modellen skall avspegla vår tilltro till olika möjligheter. Som objektivister är vi ute efter en bra modell av verkligheten. Men tänk på att en modell inte är verkligheten utan en förenklad bild av verkligheten. Modellen kan vara bra och den kan vara dålig. Är vi ”objektivister” är naturligtvis målet att sätta sannolikheterna på ett sådant sätt att de så väl som möjligt överensstämmer med de sanna sannolikheterna.

119 119 Ibland kan vi använda oss av ett symmetriresonemang (t.ex. vid tärningskast). Sannolikheten för en händelse A blir då: Om tärningen är någorlunda symmetrisk ger detta en modell som oftast är tillräckligt bra.

120 120 Om försöket upprepats ofta kan man utnyttja information från tidigare försök, i form av relativa frekvenser, för att bestämma sannolikheterna i modellen. Ibland kan modellens sannolikheter sättas utifrån teoretiska överväganden. Slutligen så kan vi naturligtvis också gissa och hoppas att vår gissning ligger någorlunda nära den sanna sannolikheten.

121 121 Betingade sannolikheter Antag att vi kastar en tärning och noterar antalet prickar som kommer upp. Låt A vara händelsen ”udda antal prickar”, dvs. A={1, 3, 5}. Låt B vara händelsen ”antalet prickar är mindre än eller lika med tre”, dvs. B={1, 2, 3}.

122 122 Låt oss i vår modell sätta samma sannolikhet på alla utfall, dvs. P(etta)=P(tvåa)=...=P(sexa)=1/6 Vi får då P(A)=3/6=1/2 P(B)=3/6=1/2

123 123 Men vad blir sannolikheten att A inträffar givet (betingat på) att B inträffar? Om vi vet att B inträffar, så vet vi att vi får antingen 1, 2 eller 3. Händelsen A (udda antal prickar) blir {1, 3}. Av tre möjliga utfall innebär alltså två att händelsen A inträffar. Sannolikheten för A givet B bör alltså bli 2/3.

124 124 Den betingade sannolikheten för A givet B kan skrivas som: där

125 125 I vårt fall har vi

126 126 Sannolikhetslärans multiplikationssats Om vi utgår ifrån och multiplicerar båda sidor med P(B), så får vi sannolikhetslärans multiplikationssats:

127 127 Oberoende händelser Låt händelsen C vara ”antalet prickar är mindre än eller lika med två”.

128 128 Vi ser då att Det faktum att A med säkerhet inträffar innebär inte att sannolikheten för C ändras. A och C kallas för oberoende händelser Multiplikationssatsen om händelserna är oberoende:

129 129 Bayes sats Antag att vi i en population har följande relativa frekvenser

130 130 Vi plockar en individ slumpmässigt. Vad är sannolikheten att individen är rökare? En individ som är rökare kan vi få på två ”sätt”: –Vi drar en individ som är rökare och har lungcancer. –Vi drar en individ som är rökare och som ej har lungcancer.

131 131 Låt R vara händelsen att vi får en individ som är rökare och L händelsen att vi får en individ som har lungcancer. Vi ser att Sannolikheten för R kan vi skriva som

132 132 Vi ser att vi genom att använda multiplikationssatsen får följande:

133 133 V. Diskreta sannolikhetsfördelningar

134 134 Variabler En variabel är en egenskap hos en individ eller ett objekt. En variabel kan, som vi tidigare sett, vara kvalitativ eller kvantitativ. En kvantitativ variabel kan vara antingen kontinuerlig eller diskret.

135 135 Kontinuerliga variabler En kontinuerlig variabel är en variabel som, inom ett visst intervall, kan anta vilka värden som helst. Exempel: –En människas längd kan vara 174.0 cm, eller 175.384957383... cm. Inom t.ex. intervallet 174 - 176 finns det inget värde som inte kan vara en människas längd.

136 136 Diskreta variabler En diskret variabel är en variabel som bara kan anta vissa (ett uppräkneligt antal) värden. Exempel: –Antalet prickar som kommer upp då man kastar en tärning. –Antal fiskar i en sjö. Observera att antalet möjliga värden som variabeln kan anta inte behöver vara ändligt.

137 137 Slumpvariabler En slumpvariabel (stokastisk variabel) är en variabel vars värde bestäms av ett slumpmässigt försök. Definition: –En slumpvariabel är en funktion definierad på ett utfallsrum.

138 138 Beteckningar Vi kommer att använda stora bokstäver (ofta X eller Y) för att beteckna slumpvariabler och små bokstäver för att beteckna värden på slumpvariabler. P(X=x), eller p(x), betyder alltså ”sannolikheten att slumpvariabeln X antar värdet x”.

139 139 Sannolikhetsfördelningar Den modell som visar vilka värden en s.v. kan anta och sannolikheterna för dessa värden brukar kallas för variabelns sannolikhetsfördelning.

140 140 Väntevärde och varians Sannolikhetsfördelningar för olika s.v. kan skilja sig åt på många sätt. De kan t.ex. ha olika –läge –spridning –snedhet –toppighet

141 141 Väntevärde Ett mått på en fördelnings läge är det förväntade värdet, eller väntevärdet. Om variabeln är diskret definieras variabelns väntevärde av

142 142 Variansen Som mått på spridning används ofta variansen eller standardavvikelsen. Om variabeln är diskret definieras variansen av

143 143 Vid beräkning av variansen är ofta följande relation användbar

144 144 Standardavvikelsen Standardavvikelsen för en slumpvariabel definieras som

145 145 Räkneregler för väntevärden och varianser Låt a och b vara konstanter och X och Y slumpvariabler. E(a)=a E(bX)=bE(X) E(a+bX)=a+bE(X)

146 146 V(a)=0 V(bX)=b 2 V(X) V(a+bX)= b 2 V(X)

147 147 E(aX+bY)=aE(X)+bE(Y) Om X och Y är oberoende gäller att –V(aX+bY)=a 2 V(X)+b 2 V(Y) –V(aX-bY)=a 2 V(X)+b 2 V(Y)

148 148 Bernoullifördelningen Ett försök som endast har två möjliga utfall kallas för ett bernoulliförsök. Om vi i ett sådant försök identifierar en s.v. som antar värdet 1 med sannolikheten p och värdet 0 med sannolikheten 1-p, sägs den s.v. vara bernoullifördelad.

149 149 Exempel: –Tärningskast. Låt variabeln X vara 1 om vi får sexa och 0 för övrigt. Modell: xp(x) 05/6 11/6 –Vi kan även skriva detta som en formel: p(x)=p x (1-p) 1-x för x = 0, 1

150 150 Om X är en bernoullifördelad variabel gäller att –E(X)=p –V(X)=p(1-p)

151 151 Binomialfördelningen Låt X vara antalet sexor vid tre kast med en tärning. Låt Y 1 vara en s.v. som antar värdet 1 om vi får sexa i första kastet och värdet 0 om vi får något annat. Låt Y 2 och Y 3 vara motsvarande för kast två och tre.

152 152 Observera att X=Y 1 +Y 2 +Y 3. Vi ser att X är en summa av bernoullifördelade variabler. Om vi kan anta att –Y 1, Y 2 och Y 3 har samma fördelning, dvs. samma p –Y 1, Y 2 och Y 3 är oberoende så är X binomialfördelad.

153 153 En s.v. som är en summa av oberoende och likafördelade bernoullifördelade s.v. säges vara binomialfördelad. Kodbeteckning X ~ bin(n,p). Fördelningen bestäms helt av n = antalet försök, dvs. antalet bernoullifördelade variabler i summan, samt p = sannolikheten för 1 i varje enskilt försök.

154 154 Binomialfördelningen kan vi skriva på följande sätt: för x = 0, 1, 2,…, n Väntevärdet: E(X) = np Variansen: V(X) = np(1-p)

155 155 VI. Kontinuerliga sannolikhetsfördelningar

156 156 Täthetsfunktion Om variabeln är kontinuerlig är P(X=x)=0. Om variabeln är kontinuerlig beräknar vi sannolikheter för intervall. Dessa sannolikheter beräknas som ytor under en funktion f(x) som kallas för täthetsfunktionen.

157 157 Om f(x) är en täthetsfunktion gäller alltid

158 158 Observera att Observera också att

159 159 Normalfördelningen Täthetsfunktionen: Väntevärdet: E(X) =  Variansen: V(X) =  2 Kodbeteckning: X ~ N(  )

160 160 För en normalfördelning gäller följande: –Ungefär 68% av ytan under kurvan ligger inom en standardavvikelse från medelvärdet. –Ungefär 95% av ytan under kurvan ligger inom två standardavvikelser från medelvärdet. –Ungefär 99,7% av ytan under kurvan ligger inom tre standardavvikelser från medelvärdet.

161 161 Exempel: –Antag att intelligensen i en population, mätt med ett visst intelligenstest, kan beskrivas av en normalfördelning med medelvärdet 100 och standardavvikelsen 15. –Då vet vi att ungefär 68% av populationen ligger mellan 85 och 115, ungefär 95 % av populationen mellan 70 och 130 och ungefär 99,7 % av populationen mellan 55 och 145

162 162 Standardnormalfördelningen Som vi ser finns det ett oändligt antal normalfördelningar. För varje val av  (medelvärde) och  (standardavvikelse) ges en ny normalfördelning. Om variabeln X är normalfördelad så gäller att variabeln Z=(X-  )/  är standardnormalfördelad. Detta innebär att Z är normalfördelad med medelvärdet 0 och standardavvikelsen 1. För standardnormalfördelningen finns tabeller med beräknade areor.

163 163 Exempel Antag att fördelningen av variabeln X i en population kan beskrivas av en normalfördelning med medelvärdet 4 och standardavvikelsen 2. Detta innebär att ungefär 68% ligger mellan 2 och 6, ungefär 95% mellan 0 och 8 och ungefär 99,7% mellan –2 och 10.

164 164 Lägg märke till att värdena 6, 8 och 10 på variabeln X motsvaras av värdena 1, 2 och 3 på variabeln Z. Z-värdena anger alltså antalet standardavvikelser från medelvärdet. X-värdet 6 är ju en standardavvikelse över medelvärdet, 8 är två standardavvikelser över medelvärdet, osv.

165 165 VII. Samplingfördelningar

166 166 Parametrar och statistikor En parameter är en konstant som ”karakteriserar” en population eller en modell. Exempel: –Populationsmedelvärdet –Parametern p i binomialfördelningen

167 167 Vi har hittills berört problem av följande typ: –Antag att proportionen moderater i en population är 0.20. Vad är sannolikheten att få två moderater om vi slumpmässigt väljer tio individer ur populationen?

168 168 När vi kommer över till statistikteorin handlar det i stället om att utifrån ett stickprov dra slutsatser om en population. Estimation: –Vi vill med hjälp av ett stickprov skatta proportionen moderater i populationen. Hur gör vi detta på ”bästa” sätt och hur säker är vår uppskattning?

169 169 Hypotesprövning: –Vår hypotes är att proportionen moderater i populationen är minst 0.25. Hur skall vi med hjälp av ett stickprov avgöra om hypotesen är falsk eller ej?

170 170 Vid såväl estimation som hypotesprövning använder vi observationerna i stickprovet för att räkna fram numeriska värden av olika slag. Exempel: –Vi använder kanske stickprovsproportionen för att uppskatta populationsproportionen.

171 171 Numeriska värden som på detta sätt beräknas med hjälp av observationerna i ett stickprov kallas för statistikor. Observera att en statistika är en slumpvariabel eftersom dess värde bestäms av ett slumpmässigt försök och varierar från stickprov till stickprov. Exempel på statistikor: Stickprovsmedelvärdet, stickprovsstandardavvikelsen

172 172 Statistikor som används för estimation kallas för estimatorer. Observationer på estimatorer kallas för estimat. Statistikor som används vid hypotesprövning brukar kallas för teststatistikor.

173 173 Samplingfördelningar och centrala gränsvärdessatsen En samplingfördelning är en sannolikhetsfördelning för en statistika.

174 174 Centrala gränsvärdessatsen Oavsett formen på den populationsfördelning ett slumpmässigt stickprov hämtas från, förutsatt att fördelningen har finit väntevärde och varians, så går fördelningen för stickprovsmedelvärdet mot normalfördelningen då stickprovsstorleken ökar.

175 175 Centrala gränsvärdessatsen är även tillämpbar på summor av oberoende slumpvariabler. –Exempel: En binomialfördelad variabel, som består av en summa av oberoende bernoullifördelade variabler, tenderar att bli normalfördelad då n ökar.

176 176 Hur stort stickprov som behövs för att normalfördelningen skall kunna användas som en approximativ modell beror på hur populationsfördelningen ser ut. Tumregel: I de flesta fall är normalfördelningen en tillräckligt god approximation redan vid stickprovsstorleken 30.

177 177 Fördelningen för stickprovsmedelvärdet Om vi samplar från en normalfördelning är stickprovsmedelvärdet alltid normalfördelat oavsett stickprovsstorlek. Om vi samplar från någon annan fördelning är stickprovsmedelvärdet approximativt normalfördelat om stickprovet är ”stort”.

178 178 Stickprovsmedelvärdets väntevärde och varians Låt n vara stickprovsstorleken och låt  och  2 vara medelvärdet och variansen i den population vi samplar ur. Väntevärde: Varians:

179 179 Fördelningen för stickprovsproportionen Exempel: –Tag ett stickprov av n st individer och sätt man=1 och kvinna=0. –Vi har då observationer på n st bernoullifördelade variabler, X 1,...,X n. –Om vi antar oberoende mellan variablerna är summan av dem, dvs. antalet män i stickprovet, binomialfördelad.

180 180 –Bilda andelen män i stickprovet, dvs. stickprovsproportionen:

181 181 Som vi ser i exemplet är stickprovsproportionen inget annat än ett stickprovsmedelvärde där variablerna i summan i täljaren är bernoullifördelade. Om stickprovet är stort kan vi, med stöd av centrala gränsvärdessatsen, hävda att stickprovsproportionen är approximativt normalfördelad. Tumregel: och

182 182 Vi såg tidigare att väntevärdet och variansen för stickprovsmedelvärdet var lika med populationens medelvärde och populationens varians dividerad med stickprovsstorleken. När populationen är bernoullifördelad är populationens medelvärde p och populationens varians p(1-p). Väntevärde och varians

183 183 Väntevärdet: Variansen:

184 184 VIII. Estimation

185 185 Estimatorer och deras egenskaper Exempel: –Antag att vi vill skatta medelvärdet i en population. För att göra detta tar vi ett stickprov bestående av n=9 observationer. Vilken av följande tre estimatorer är ”bäst”?

186 186 Väntevärdesriktighet Ett kriterium för utvärdering av estimatorer är väntevärdesriktighet. En estimator är väntevärdesriktig (unbiased) om väntevärdet för estimatorn sammanfaller med den parameter man vill skatta.

187 187 I exemplet ovan är de två första estimatorerna väntevärdesriktiga medan den tredje är biased.

188 188 Relativ effektivitet En estimator sägs vara effektivare än en annan estimator om dess varians är mindre. I exemplet ovan får vi

189 189 Konsistens En estimator är konsistent om sannolikheten att esimatorn hamnar väldigt nära parametervärdet går mot 1 då stickprovsstorleken ökar. Konsistens innebär att såväl bias som varians måste gå mot noll då stickprovsstorleken ökar.

190 190 I vårt exempel är det endast stickprovsmedelvärdet som är en konsistent estimator. Medelvärdet av den första och den sista observationen har en varians som inte minskar hur stort stickprov vi än tar. Stickprovsmedelvärdet plus ett har en bias som inte försvinner hur stort stickprov vi än tar.

191 191 Punktestimation och intervallestimation Punktestimation: –Som punktestimator för populationsmedelvärdet , använder vi stickprovsmedelvärdet. –Som punktestimator för populationsproportionen p, använder vi stickprovsproportionen.

192 192 – dvs. båda estimatorerna är väntevärdesriktiga. –Estimatorerna är dessutom konsistenta och effektiva. –Observationer på estimatorerna kallar vi för (punkt-)estimat.

193 193 Intervallestimation: –Antag att vi studerar en egenskap X i en population. –X~N( , 2) –Vi vet då att

194 194 –Vi vill skatta  med hjälp av ett stickprov bestående av 9 observationer, dvs. n = 9. –Vad är sannolikheten att vi skall få ett stickprovsmedelvärde som ligger max från  ? –Svar: 0.95

195 195 –Om vi upprepar försöket väldigt många gånger, dvs. vi tar ett stort antal stickprov och beräknar stickprovsmedelvärdet, så kommer vi att hamna max från  i ca 95% av fallen.

196 196 –Antag att vi alltid bildar följande intervall där är observerat stickprovsmedelvärde. Observera att detta stickprovsmedelvärde varierar från sampel till sampel, vilket innebär att intervallet också varierar från sampel till sampel. –Hur ofta kommer vi då att, i det långa loppet, få ett intervall som ”täcker”  ? –Svar: I ca. 95% av fallen.

197 197 –Intervallet kallas för ett 95%-igt konfidensintervall för populationsmedelvärdet.

198 198 Konfidensintervall för  och p. Stora sampel. Konfidensintervall för .  känd. –Om samplet är stort (tumregel: n minst 30) så är stickprovsmedelvärdet åtminstone approximativt normalfördelat, oavsett fördelning i populationen. (Är populationen normalfördelad så är stickprovsmedelvärdet exakt normalfördelat).

199 199 –Av detta följer att –95%-igt k.i. för  :

200 200 Konfidensintervall för .  okänd. –Om samplet är stort gäller approximativt att –95%-igt k.i. För  :

201 201 Konfidensintervall för p. –Om samplet är stort (tumregel: np minst 5 och n(1-p) minst 5) gäller att är approximativt normalfördelad och därmed –Observera att  = p(1-p) alltid är okänd eftersom vi ej vet p. –Konfidensintervallet blir då

202 202 Ett par exempel Exempel 1 –Antag att vi med hjälp av ett stickprov bestående av 100 individer vill skatta genomsnittsintelligensen (mätt med ett IQ-test) i en population. Antag vidare att vi vet att standardavvikelsen i populationen är  =15.

203 203 –Vi vet då följande: 1. Om vi tar upprepade stickprov bestående av n=100 individer kan stickprovsmedelvärdets variation mellan olika stickprov beskrivas av en normalfördelning med standardavvikelsen 2. I 95% av alla stickprov kommer stickprovsmedelvärdet att vara högst ungefär enheter ifrån populationmedelvärdet.(Jag har avrundat 1.96 till 2).

204 204 Antag att vi får stickprovsmedelvärdet 97. Då sträcker sig det 95%-iga konfidensintervallet från 94 till 100. Vi kan alltså med 95%-ig konfidens påstå att populationsmedelvärdet ligger mellan 94 och 100. Vi baserar denna konfidens på att vi använt en metod som ger oss rätt i 95% av fallen i det långa loppet. Observera att om vi gör många undersökningar och alltid beräknar 95%-iga konfidensintervall så kommer vi också att ”missa” populations- medelvärdet i ca 5% av fallen i det långa loppet.

205 205 Exempel 2 –Antag att vi, med hjälp av ett stickprov bestående av n=3000 individer, vill skatta andelen i populationen som skulle rösta på socialdemokraterna om det vore val idag.

206 206 –Vi vet följande: 1. Om vi tar upprepade stickprov bestående av n=3000 individer kan stickprovsproportionens variation mellan olika stickprov beskrivas av en normalfördelning med standardavvikelsen där p är populationsproportionen.

207 207 2. I 95% av fallen kommer stickprovsproportionen att vara högst ifrån populationsproportionen. 3. Ovanstående stämmer approximativt även om vi ersätter populationsproportionen med stickprovsproportionen, dvs. om vi använder

208 208 –Antag att 1200 av 3000 svarar att de skulle rösta på socialdemokraterna om det vore val idag. Vi får då –Det 95%-iga konfidensintervallet blir

209 209 –Felmarginalen är då 1.8 procentenheter. –Vi kan vara ganska säkra på att andelen i populationen ligger mellan 38.2 % och 41.8 %, eftersom vi använt en metod som, i det långa loppet, ger oss rätt i 95 % av fallen.

210 210 Konfidensintervall för . Små sampel. Med små sampel måste vi veta fördelningen i populationen för att kunna härleda fördelningen för stickprovsmedelvärdet. Konfidensintervall då  är känd. –Om populationen är normalfördelad så är stickprovsmedelvärdet normalfördelat och

211 211 Konfidensintervall för  då  är okänd. –Om populationen är normalfördelad så är stickprovsmedelvärdet normalfördelat och

212 212 –Observera att då n går mot oändligheten så går t-fördelningen mot standardnormal- fördelningen. Detta innebär att man med stora sampel kan använda standardnormalfördelningen som approximation även i de fall då statistikan egentligen är t-fördelad. –95%-igt konfidensintervall för  :

213 213 Stickprovsdimensionering Skattning av  –I ett 95%-igt konfidensintervall är halva intervallets längd –Vi kan ”lösa ut” n, och får då

214 214 –Vi ser då att om vi på något sätt kan få ett uppskattat ”planeringsvärde” på standardavvikelsen, så kan vi för önskad längd på konfidensintervallet beräkna hur stort sampel vi behöver ta.

215 215 Skattning av p – Eftersom populationen är bernoullifördelad är variansen p(1-p), vilket ger –I detta fall kan vi dessutom använda p = 0.5 som ett ”konservativt” planeringsvärde för p, eftersom variansen aldrig är större än då p = 0.5. Sätter vi p = 0.5 får vi aldrig ett för litet stickprov (däremot blir kanske stickprovet ibland onödigt stort).

216 216 IX. Hypotesprövning

217 217 Statistisk hypotesprövning och hypotetisk-deduktiv metod Hypotetisk-deduktiv metod: –Hypotes: Alla svanar är vita. –Empirisk konsekvens: Om a är en svan så är a vit. Om jag väljer en svan slumpmässigt så är sannolikheten ett att den är vit, givet att hypotesen är sann. –Observation: a är en svan och a är svart. –Slutsats: Hypotesen är falsk. Förkasta hypotesen.

218 218 –Om hypotesen är sann kan jag omöjligt se en svan som är svart. P(svart svan givet hypotesen sann) = 0. Antingen har jag sett något som är omöjligt eller också är hypotesen falsk. Statistisk hypotesprövning: –Hypotes:  =  0 (Eventuell hjälphypotes: T.ex. populationen är normalfördelad).

219 219 –Empirisk konsekvens: Sannolikheten att få ett stickprovsmedelvärde som ligger max ifrån  0 är 0,95. Om jag drar ett urval slumpmässigt och beräknar stickprovsmedelvärdet förväntar jag mig att få ett värde som ligger max 1.96 standardavvikelser från nollhypotesens värde (ett z-värde mellan –1.96 och 1.96), eftersom sannolikheten är så hög (0,95) att hamna där, givet att hypotesen är sann.

220 220 –Exempel på observation: Stickprovsmedelvärdet ligger mer än två standardavvikelser från den hypotes vi har om populationsmedelvärdet (ekvivalent får vi ett z- värde som är mindre än –2 eller större än 2) –Slutsats: Förkasta hypotesen. –Om hypotesen är sann är sannolikheten mycket liten, endast 0,05, att jag skall få en observation på stickprovsmedelvärdet som ligger så långt ifrån populationsmedelvärdet. Antingen har jag sett något som är osannolikt eller också är hypotesen falsk.

221 221 Formulering av hypoteser Test av ett populationsmedelvärde eller en populationsproportion. –Dubbelsidigt test: H 0 :  =  0, H A :   0 H 0 : p = p 0, H A : p  p 0 Vi vill se om vi kan få empiriskt stöd för hypotesen att   0 (eller p  p 0 ). Observera att det vi vill undersöka om vi kan få stöd för (det vi vill ”bevisa”) sätts i alternativhypotesen.

222 222 Att förkasta nollhypotesen är ett ”starkt” beslut, vi har starkt empiriskt stöd för alternativhypotesen. Att ej förkasta nollhypotesen är ett ”svagt” beslut. Vi kan i regel ej dra slutsatsen att nollhypotesen är sann bara för att ”bevisen” inte räcker för att hävda motsatsen. Enkelsidigt test: H 0 :  =  0  H A :  >  0 H 0 : p =  p 0, H A : p > p 0 Vi vill se om vi kan få stöd för hypotesen att  >  0 (p > p 0 ). H 0 :  =  0  H A :  <  0 H 0 : p =  p 0, H A : p < p 0 Vi vill se om vi kan få stöd för hypotesen att  <  0 (p < p 0 ).

223 223 Test av skillnad mellan två populationsmedelvärden. –Dubbelsidigt test. Oftast (dock inte alltid) är nollhypotesen att det inte finns någon skillnad. H 0 :  A =  B, H A :  A   B Ekvivalent kan vi skriva H 0 :  A -  B = 0, H A :  A -  B  0

224 224 –Enkelsidigt test. Om vi vill undersöka om det finns empiriskt stöd för hypotesen att  A   B skriver vi: H 0 :  A =  B, H A :  A   B Ekvivalent kan vi skriva H 0 :  A -  B = 0, H A :  A -  B  0 Om vi vill undersöka om det finns empiriskt stöd för hypotesen att  A   B skriver vi: H 0 :  A =  B, H A :  A   B Ekvivalent kan vi skriva H 0 :  A -  B = 0, H A :  A -  B  0

225 225 Val av teststatistika Vi har olika teststatistikor för olika situationer. Principen är att man väljer en teststatistika vars fördelning är känd då nollhypotesen är sann. Vi vill ju veta vilka värden på teststatistikan vi kan förvänta oss och vilka värden som är osannolika om nollhypotesen är sann.

226 226 Kritiskt område För att kunna bestämma ett kritiskt område (rejection region) behöver vi, förutom en teststatistika vars fördelning är känd under nollhypotesen, även en signifikansnivå. Principen är att vi skall förkasta nollhypotesen om vi observerar något som är osannolikt om nollhypotesen är sann. Men hur osannolikt måste det vara? En vanlig gräns är 0.05. Signifikansnivån är då 0.05, eller 5%.

227 227 Har vi bestämt oss för en signifikansnivå och vet teststatistikans fördelning under nollhypotesen kan vi härleda för vilka värden på teststatistikan vi skall förkasta nollhypotesen. Exempel: Normalfördelad population.  = 3 –H 0 :  = 10, H A :   10 –Signifikansnivå:  = 0.05

228 228 –Teststatistika: – Eller, ekvivalent: –I båda fallen gäller fördelningarna under förutsättning att nollhypotesen är sann.

229 229 –Dvs. om nollhypotesen är sann är sannolikheten 0.05 att få ett värde på stickprovsmedelvärdet som är mindre än eller större än –Ekvivalent kan vi säga att sannolikheten är 0.05 att få ett värde på Z som är mindre än -1.96 eller större än 1.96.

230 230 –Kritiskt område: Förkasta nollhypotesen om eller om Ekvivalent kan vi förkasta nollhypotesen om eller om z > 1.96

231 231 Observation och slutsats När vi väl bestämt oss för vilka värden på teststatistikan vi skall förkasta nollhypotesen (ett ”kritiskt område”) samlar vi in data, beräknar en observation på teststatistikan och ser om vår observation hamnar i det kritiska området. Får vi ett värde i det kritiska området förkastas nollhypotesen. Får vi ett värde som ej är i det kritiska området förkastar vi inte nollhypotesen.

232 232 Fortsättning på exemplet. –Vi tar ett sampel omfattande 16 observationer. De kritiska gränserna blir då 8.53 och 11.47. –Antag att vi får stickprovsmedelvärdet 12. –Slutsatsen blir då att förkasta nollhypotesen. Vi anser oss ha tillräckligt empiriskt stöd för alternativhypotesen. ”Bevisen” räcker för att ”fälla” nollhypotesen. –Ekvivalent kan vi beräkna en observation på Z. Sätter vi in det observerade stickprovs-medelvärdet 12 och n = 16 får vi z = 2.67, vilket är utanför gränsen 1.96. Slutsatsen blir naturligtvis densamma.

233 233 Typ I fel och typ II fel. Typ I fel: Att förkasta nollhypotesen då den är sann. Sannolikheten för detta är signifikansnivån . Typ II fel: Att ej förkasta nollhypotesen då den är falsk. Sannolikheten för detta kallas för 

234 234 P-värden Ett p-värde är sannolikheten att, om nollhypotesen är sann (vid en upprepning av försöket) få ett minst lika ”extremt” värde på teststatistikan som det vi faktiskt fått. Med ”extremt” avses i förhållande till nollhypotesen och vad som räknas som ”extremt” beror därför på hypoteserna.

235 235 Exempel 1: –H 0 :  = 10, H A :   0. –Antag att vi få observationen z = 2.67. –P-värdet = Sannolikheten att få ett stickprovsmedelvärde som ligger minst 2.67 standardavvikelser från 10, dvs. sannolikheten att få ett värde på z som är större än 2.67 eller mindre än –2.67 = 0.0076 Exempel 2: –H 0 :   10, H A :   0 –z = 2.67 –P-värdet = Sannolikheten att få ett stickprovsmedelvärde som ligger minst 2.67 standardavvikelser över 10 = 0.0038


Ladda ner ppt "1 I. Statistiska undersökningar Ett gemensamt syfte för alla undersökningar är att få ökad kunskap om ett visst problemområde Det kanske viktigaste sättet."

Liknande presentationer


Google-annonser