Presentation laddar. Vänta.

Presentation laddar. Vänta.

732G70 STATISTIK A, 7HP Linda Wänström Tommy Schyman

Liknande presentationer


En presentation över ämnet: "732G70 STATISTIK A, 7HP Linda Wänström Tommy Schyman"— Presentationens avskrift:

1 732G70 STATISTIK A, 7HP Linda Wänström Tommy Schyman

2 Kursupplägg 10 föreläsningar 4 lektioner 4 räknestugor 3 datorövningar (labbar)

3 Kurslitteratur Tillämpad statistik – en grundkurs av Karl Wahlin Kurskompendium med extra övningsuppgifter Föreläsningsunderlag läggs ut på kurshemsidan senast kvällen innan föreläsningen.

4 Examination Skriftlig salstentamen den 16 april Hjälpmedel: Valfri miniräknare Kursboken Får innehålla markeringar och överstrykningar men inte anteckningar

5 Kurshemsida Föreläsningsunderlag Schema med läsanvisningar Datorövningar Gruppindelning till datorövningar Kursplan Information

6 KAPITEL 2 Populationer, stickprov och variabler Sid 11-46

7 Population och stickprov Population: Den samling enheter (exempelvis individer) som vi vill dra slutsatser om Urvalsram En förteckning över populationens enheter Antalet enheter i populationen betecknas med N Stickprov: urval av enheter från populationen Antalet enheter i stickprovet betecknas med n Exempel Frågeställning: Hur skulle svenska folket rösta om det var val i dag? Population? Urvalsram? Stickprov?

8 Ändliga och oändliga populationer Oändlig population Sannolikheten att en enhet ska väljas ut ändras inte mellan dragningarna Oberoende mellan dragningarna Dragning med återläggning Ändlig population Sannolikheten att en enhet ska väljas ut ändras mellan dragningarna Ej oberoende mellan dragningarna Dragning utan återläggning Tumregel: populationen kan betraktas som oändlig om urvalet utgör mindre än 10% av populationsstorleken.

9 Variabel En egenskap som varierar Kvalitativ variabel Variabel som ej antar numeriska värden Kvantitativ variabel Variabel som antar numeriska värden Diskreta kvantitativa variabler Kan endast anta ett ändligt antal värden, eller ett oändligt men uppräkneligt antal värden Ofta heltalsvärden Kontinuerliga kvantitativa variabler Kan anta ett oändligt antal värden inom ett intervall

10 Skalor En variabel är mätt med en viss skala Nominalskala Det går endast att kategorisera variabelvärdena Ordinalskala Det går att kategorisera OCH rangordna variabelvärdena Metrisk skala Det går att kategorisera och rangordna variabelvärdena, dessutom är avstånden mellan variabelvärdena desamma Exempel: Vilket parti skulle du rösta på om det var val i dag? __________ Hur gammal är du? ___________ Hur gammal är du? 18-25, 26-35, 36-64, 65+ Hur väl instämmer du i följande påstående: …. (håller helt med, håller delvis med, varken håller med eller tar avstånd, tar delvis avstånd, tar helt avstånd)?

11 Tabeller och diagram Med tabeller och diagram kan vi åskådliggöra fördelningen för en/flera variabler Tabell 2: Preliminärt röstberättigade svenska medborgare folkbokförda i Sverige vid riksdagsvalet 2014 efter valkrets, kön och ålder. Antal och procent RiksdagsvalkretsAntalKvinnorMänTotalt antal röstberättigade Procent18-29 år30-64 år65- årSumma18-29 år30-64 år65- årSumma18-29 år30-64 år65- årSumma Hela riket ,253,628,210019,756,024,310018,954,826,3100 Stockholms kommun ,558,621,910019,762,917,410019,660,719,8100 Stockholms län ,856,925,310019,758,521,810018,757,723,5100 Uppsala län ,652,825,610022,654,422,910022,153,624,3100 Södermanlands län ,652,231,210018,354,227,510017,453,229,4100 Östergötlands län ,252,028,810021,454,324,410020,353,126,6100

12 Frekvenstabell En tabell som anger frekvens (absoluta och/eller relativa frekvenser) för varje variabelvärde Passar för kvalitativ variabel eller kvantitativ med få värden Exempel: ”Vilket parti skulle du rösta på i riksdagsvalet om det var val i dag?” Undersökning gjord av SIFO i mars 2014 Baserad på 1934 intervjuer PartiAndel(%) Socialdemokraterna34.1 Vänsterpartiet6.3 Miljöpartiet10.1 Moderaterna24.2 Centerpartiet4.7 Folkpartiet5.4 Kristdemokraterna4.7 Sverigedemokraterna8.0 Övriga2.5 Totalt100

13 Stapeldiagram På x-axeln har vi de olika variabelvärdena På y-axeln har vi frekvenserna ( i detta fall procent) Passar för kvalitativ variabel

14 Cirkeldiagram Passar för kvalitativ variabel

15 Stolpdiagram Som stapeldiagram, men stolparna är tunnare Passar kvantitativ diskret variabel med få värden Exempel: Antal barn i ett stickprov med 3340 kvinnor i USA

16 Histogram Passar kvantitativa kontinuerliga variabler Variabelvärdena måste först klassindelas Exempel: Hushållsinkomst för de amerikanska kvinnorna (från tidigare)

17 Histogram Urval av hushållsinkomster (i dollar): 100, 300, 600, 800, 2000, 2100, 2100, 2200, 2500, 2700, 2800, 2900, 3000, 3100, 3200, 3300, 3500, 4000, 4800, 5500 Klassindela på ett rimligt sätt, exempelvis: 0-999, , , , ,

18 Stam- och bladdiagram Ett slags histogram som står upp, där varje värde åskådliggörs Passar kvantitativa (både diskreta och kontinuerliga) variabler Siffrorna delas upp i ”stam” och ”blad” Exempel (forts): 100, 300, 600, 800, 2000, 2100, 2100, 2200, 2500, 2700, 2800, 2900, 3000, 3100, 3200, 3300, 3500, 4000, 4800, 5500 Stam: 1000-tal, dvs 0, 1, 2, 3, 4, 5

19 Beskrivande mått Andel/proportion (lägesmått) För kvalitativa eller kvantitativa variabler För stickprov: För population: Exempel: I SIFOS urval (i mars 2014) svarade 659 av1934 att de skulle rösta på socialdemokraterna om det var val i dag.

20 Typvärde (lägesmått) Variabelvärdet som förekommer med högst frekvens För kvalitativa eller kvantitativa variabler Exempel: Vad är typvärdet för antal barn för de amerikanska kvinnorna (från tidigare)? Vad är typvärdet för partisympati enligt SIFOs undersöknining?

21 (Aritmetiskt) medelvärde (lägesmått) För kvantitativa variabler För stickprov: För population: Exempel: Vad är medelvärdet för urvalet av inkomster?

22 Vägt medelvärde (lägesmått) Medelvärde för grupperade (klassindelade) data i en frekvenstabell För stickprov För population där g är antal grupper/klasser Vad blir medelvärdet för klassindelade inkomsten?

23 Median (lägesmått) Det mittersta värdet i en fördelning, när alla värden har storleksordnats För kvantitativa och kvalitativa variabler på minst ordinaldatanivå Medianen, M, har position Vad är medianinkomsten (för icke-klassindelade data)?

24 Varians och standardavvikelse (spridningsmått) Mäter ”spridningen” av data runt medelvärdet För kvantitativa variabler För stickprov För population Vad är standardavvikelsen för inkomsterna?

25 Varians och standardavvikelse (spridningsmått) Varians och standardavvikelse för grupperade/klassindelade data i en frekvenstabell För stickprov För population Vad är standardavvikelsen för de klassindelade inkomsterna?

26 Kvartilavstånd (spridningsmått) För kvantitativa variabler q3-q1 där q1 (första kvartilen) är mittersta värdet i första halvan av data q3 (tredje kvartilen) är mittersta värdet i andra halvan av data Kvartiler kan även beräknas på kvalitativa variabler på ordinaldatanivå

27 Lådagram Ett diagram som använder sig av median och kvartiler En låda som begränsas av första och tredje kvartilen ritas, där medianen är utsatt med ett streck i lådan Streck från lådan till den minsta och största observationen dras Rita ett lådagram för följande observationer: 1, 2, 3, 3, 3, 4, 5, 6, 6, 7, 10, 11

28 Standardvägning En metod för att jämföra medelvärden för olika grupper där man tar hänsyn till att grupperna kan skilja sig åt i fördelningen för en annan variabel Exempel: Medellöner för män och kvinnor efter arbetslivserfarenhet på ett företag Enligt formel för vägt medelvärde får vi Känns denna jämförelse rättvis? Om vi i stället beräknar vägda medelvärden men använder totalantalet som vikter får vi KvinnorMän ArbetserfarenhetAntalMedellönAntalMedellön 10 år eller mer år år år

29 KAPITEL 3 Sannolikhetsteori sid 47-78

30 Mängdlära Används för att förstå och åskådliggöra sannolikheter När vi utför ett experiment (slumpmässigt försök) kan vi få olika utfall Exempel på experiment: Kasta en tärning, kasta ett mynt, dra ett kort från en kortlek, välj slumpmässigt en person från en population och fråga om partisympati Vilka är de möjliga utfallen? S = utfallsrum = mängden av de olika utfallen En händelse definieras som en samling utfall Exempel: A = antal udda prickar vid tärningskast, B = antal prickar högst 2 vid tärningskast

31 Venndiagram Ett diagram som åskådliggör utfallsrum och olika händelser

32 Händelser Snitt Händelsen att både A och B inträffar Union Händelsen att antingen A eller B eller båda inträffar Komplement till A Händelsen att A inte inträffar Disjunkta händelser Händelserna A och B är disjunkta om de inte kan inträffa samtidigt (dvs de har inget snitt) Oberoende händelser Händelserna A och B är oberoende om sannolikheten att händelsen A inträffar inte påverkas av om B redan inträffat eller ej, samt sannolikheten att B inträffar inte påverkas av om A redan inträffat eller ej

33 Kombinatorik En metod för att bestämma antalet sätt ett visst antal element kan väljas/ordnas i mängder Multiplikationsprincipen Används när vi i tur och ordning ska utföra k stycken operationer där antalet möjliga händelser vid varje operation är n 1, n 2,…, n k Det totala antalet sätt att utföra k operationer är Exempel: På en restaurang kan man välja mellan två förrätter, tre huvudrätter, och två efterrätter. På hur många sätt kan man skapa sin trerätters måltid?

34 Permutationer när alla element är olika Används när vi i en viss ordningsföljd vill välja ut k av n element och varje element endast får användas en gång Antalet permutationer när alla element är olika är Exempel: Av fyra längdskidåkare ska två väljas ut till ett stafettlag: en till förstasträckan och en till andrasträckan. På hur många sett kan detta ske?

35 Permutationer när vissa element är lika Används när vi vill ordna n element och där k 1 tillhör en typ, k 2 tillhör en annan typ osv Antalet permutationer när vissa element är lika är Exempel: I ett längdskidåkningslag finns två kvinnliga juniorer, två manliga juniorer, en kvinnlig senior och en manlig senior. På hur många sätt kan vi bilda stafettlag med dessa sex åkare?

36 Kombinationer utan upprepning Används när vi utan hänsyn till ordning vill välja ut k av n element och varje element endast får användas en gång Antalet kombinationer är Exempel: Av fyra längdskidåkare ska två väljas ut till ett stafettlag: På hur många sett kan detta ske?

37 Kombinationer vid upprepning Används när vi utan hänsyn till ordning vill välja ut k av n element och varje element får användas flera gånger Antalet kombinationer är Exempel: I en affär finns 4 sorter med plockgodis. På hur många sätt kan vi välja 2 godisbitar?

38 Sannolikhetslära Område inom statistiken där vi arbetar med experiment vars utfall beror på slumpen Sannolikhet: ett värde som talar om hur troligt det är att en viss händelse ska inträffa Klassiska sannolikhetsdefinitionen Regler för sannolikheter: Sannolikheten för disjunkta händelser som upptar hela utfallsrummet kommer tillsammans att summera till 1

39 Relativ frekvens Sannolikheten för en händelse är en bedömning av den relativa frekvensen för händelsen

40 Räknemetoder för sannolikheter Additionssatsen för disjunkta händelser För två händelser A och B som är disjunkta gäller att Additionssatsen för icke disjunkta händelser För två händelser A och B som inte är disjunkta gäller att Exempel: Vad är sannolikheten att få ett ess eller en kung när man drar ett kort ur en kortlek? Vad är sannolikheten att få ett ess eller ett hjärter när man drar ett kort ur en kortlek?

41 Multiplikationssatsen för oberoende händelser Om händelserna A och B är oberoende gäller Om händelserna A och B inte är oberoende gäller Exempel: Vad är sannolikheten att få två sexor vid kast av två tärningar? Vad är sannolikheten att få två ess vid dragning av två kort från en kortlek? Vad är sannolikheten att kortet vi dragit är ett ess om vi vet att kortet är minst en dam?

42 Satsen om total sannolikhet Om A 1, A 2, …, A g är disjunkta händelser, sådana att deras union tillsammans bildar hela utfallsrummet, gäller Exempel: I en fabrik tillverkas 25% av enheterna av maskin A1, 35% av maskin A2, och 40% av maskin A3. Dessutom gäller att 5% som tillverkas i maskin A1 är defekta, 4% som tillverkas i maskin A2 är defekta, och 2% som tillverkas i maskin A3 är defekta. Vad är sannolikheten att en slumpmässigt vald enhet är defekt?

43 Bayes sats Om A 1, A 2, …, A g är disjunkta händelser, sådana att deras union tillsammans bildar hela utfallsrummet, gäller Exempel (forts.): Vad är sannolikheten att en slumpmässigt vald enhet tillverkats av maskin A1 om vi vet att den är defekt?


Ladda ner ppt "732G70 STATISTIK A, 7HP Linda Wänström Tommy Schyman"

Liknande presentationer


Google-annonser