Ladda ner presentationen
Presentation laddar. Vänta.
1
732G70 Statistik A, 7hp Linda Wänström (linda.wanstrom@liu.se)
Tommy Schyman
2
Kursupplägg 10 föreläsningar 4 lektioner 4 räknestugor
3 datorövningar (labbar)
3
Kurslitteratur Tillämpad statistik – en grundkurs av Karl Wahlin
Kurskompendium med extra övningsuppgifter Föreläsningsunderlag läggs ut på kurshemsidan senast kvällen innan föreläsningen.
4
Examination Skriftlig salstentamen den 16 april Hjälpmedel:
Valfri miniräknare Kursboken Får innehålla markeringar och överstrykningar men inte anteckningar
5
Kurshemsida http://www.ida.liu.se/~732G70 Föreläsningsunderlag
Schema med läsanvisningar Datorövningar Gruppindelning till datorövningar Kursplan Information
6
Populationer, stickprov och variabler Sid 11-46
Kapitel 2 Populationer, stickprov och variabler Sid 11-46
7
Population och stickprov
Population: Den samling enheter (exempelvis individer) som vi vill dra slutsatser om Urvalsram En förteckning över populationens enheter Antalet enheter i populationen betecknas med N Stickprov: urval av enheter från populationen Antalet enheter i stickprovet betecknas med n Exempel Frågeställning: Hur skulle svenska folket rösta om det var val i dag? Population? Urvalsram? Stickprov?
8
Ändliga och oändliga populationer
Oändlig population Sannolikheten att en enhet ska väljas ut ändras inte mellan dragningarna Oberoende mellan dragningarna Dragning med återläggning Ändlig population Sannolikheten att en enhet ska väljas ut ändras mellan dragningarna Ej oberoende mellan dragningarna Dragning utan återläggning Tumregel: populationen kan betraktas som oändlig om urvalet utgör mindre än 10% av populationsstorleken.
9
Variabel Variabel Kvalitativ variabel Kvantitativ variabel
En egenskap som varierar Kvalitativ variabel Variabel som ej antar numeriska värden Kvantitativ variabel Variabel som antar numeriska värden Diskreta kvantitativa variabler Kan endast anta ett ändligt antal värden, eller ett oändligt men uppräkneligt antal värden Ofta heltalsvärden Kontinuerliga kvantitativa variabler Kan anta ett oändligt antal värden inom ett intervall
10
Skalor En variabel är mätt med en viss skala Nominalskala Ordinalskala
Det går endast att kategorisera variabelvärdena Ordinalskala Det går att kategorisera OCH rangordna variabelvärdena Metrisk skala Det går att kategorisera och rangordna variabelvärdena, dessutom är avstånden mellan variabelvärdena desamma Exempel: Vilket parti skulle du rösta på om det var val i dag? __________ Hur gammal är du? ___________ Hur gammal är du? 18-25, 26-35, 36-64, 65+ Hur väl instämmer du i följande påstående: …. (håller helt med, håller delvis med, varken håller med eller tar avstånd, tar delvis avstånd, tar helt avstånd)?
11
Totalt antal röstberättigade
Tabeller och diagram Med tabeller och diagram kan vi åskådliggöra fördelningen för en/flera variabler Tabell 2: Preliminärt röstberättigade svenska medborgare folkbokförda i Sverige vid riksdagsvalet 2014 efter valkrets, kön och ålder. Antal och procent Riksdagsvalkrets Antal Kvinnor Män Totalt antal röstberättigade Procent 18-29 år 30-64 år 65- år Summa Hela riket 18,2 53,6 28,2 100 19,7 56,0 24,3 18,9 54,8 26,3 Stockholms kommun 64 276 72 468 60 713 53 695 19,5 58,6 21,9 62,9 17,4 19,6 60,7 19,8 Stockholms län 78 337 84 078 93 019 17,8 56,9 25,3 58,5 21,8 18,7 57,7 23,5 Uppsala län 28 153 68 785 33 409 28 629 68 899 29 034 56 782 62 443 21,6 52,8 25,6 22,6 54,4 22,9 22,1 Södermanlands län 17 209 54 276 32 404 18 562 54 990 27 927 35 771 60 331 16,6 52,2 31,2 18,3 54,2 27,5 53,2 29,4 Östergötlands län 31 817 86 256 47 857 35 343 89 822 40 323 67 160 88 180 19,2 52,0 28,8 21,4 54,3 24,4 20,3 53,1 26,6
12
Frekvenstabell Parti Andel(%) Socialdemokraterna 34.1 Vänsterpartiet
En tabell som anger frekvens (absoluta och/eller relativa frekvenser) för varje variabelvärde Passar för kvalitativ variabel eller kvantitativ med få värden Exempel: ”Vilket parti skulle du rösta på i riksdagsvalet om det var val i dag?” Undersökning gjord av SIFO i mars 2014 Baserad på 1934 intervjuer Parti Andel(%) Socialdemokraterna 34.1 Vänsterpartiet 6.3 Miljöpartiet 10.1 Moderaterna 24.2 Centerpartiet 4.7 Folkpartiet 5.4 Kristdemokraterna Sverigedemokraterna 8.0 Övriga 2.5 Totalt 100
13
Stapeldiagram På x-axeln har vi de olika variabelvärdena
På y-axeln har vi frekvenserna ( i detta fall procent) Passar för kvalitativ variabel
14
Cirkeldiagram Passar för kvalitativ variabel
15
Stolpdiagram Som stapeldiagram, men stolparna är tunnare
Passar kvantitativ diskret variabel med få värden Exempel: Antal barn i ett stickprov med 3340 kvinnor i USA
16
Histogram Passar kvantitativa kontinuerliga variabler
Variabelvärdena måste först klassindelas Exempel: Hushållsinkomst för de amerikanska kvinnorna (från tidigare)
17
Histogram Urval av hushållsinkomster (i dollar): 100, 300, 600, 800, 2000, 2100, 2100, 2200, 2500, 2700, 2800, 2900, 3000, 3100, 3200, 3300, 3500, 4000, 4800, 5500 Klassindela på ett rimligt sätt, exempelvis: 0-999, , , , ,
18
Stam- och bladdiagram Ett slags histogram som står upp, där varje värde åskådliggörs Passar kvantitativa (både diskreta och kontinuerliga) variabler Siffrorna delas upp i ”stam” och ”blad” Exempel (forts): 100, 300, 600, 800, 2000, 2100, 2100, 2200, 2500, 2700, 2800, 2900, 3000, 3100, 3200, 3300, 3500, 4000, 4800, 5500 Stam: 1000-tal, dvs 0, 1, 2, 3, 4, 5
19
Beskrivande mått Andel/proportion (lägesmått)
För kvalitativa eller kvantitativa variabler För stickprov: För population: Exempel: I SIFOS urval (i mars 2014) svarade 659 av1934 att de skulle rösta på socialdemokraterna om det var val i dag.
20
Typvärde (lägesmått) Variabelvärdet som förekommer med högst frekvens
För kvalitativa eller kvantitativa variabler Exempel: Vad är typvärdet för antal barn för de amerikanska kvinnorna (från tidigare)? Vad är typvärdet för partisympati enligt SIFOs undersöknining?
21
(Aritmetiskt) medelvärde (lägesmått)
För kvantitativa variabler För stickprov: För population: Exempel: Vad är medelvärdet för urvalet av inkomster?
22
Vägt medelvärde (lägesmått)
Medelvärde för grupperade (klassindelade) data i en frekvenstabell För stickprov För population där g är antal grupper/klasser Vad blir medelvärdet för klassindelade inkomsten?
23
Median (lägesmått) Det mittersta värdet i en fördelning, när alla värden har storleksordnats För kvantitativa och kvalitativa variabler på minst ordinaldatanivå Medianen, M, har position Vad är medianinkomsten (för icke-klassindelade data)?
24
Varians och standardavvikelse (spridningsmått)
Mäter ”spridningen” av data runt medelvärdet För kvantitativa variabler För stickprov För population Vad är standardavvikelsen för inkomsterna?
25
Varians och standardavvikelse (spridningsmått)
Varians och standardavvikelse för grupperade/klassindelade data i en frekvenstabell För stickprov För population Vad är standardavvikelsen för de klassindelade inkomsterna?
26
Kvartilavstånd (spridningsmått)
För kvantitativa variabler q3-q1 där q1 (första kvartilen) är mittersta värdet i första halvan av data q3 (tredje kvartilen) är mittersta värdet i andra halvan av data Kvartiler kan även beräknas på kvalitativa variabler på ordinaldatanivå
27
Lådagram Ett diagram som använder sig av median och kvartiler
En låda som begränsas av första och tredje kvartilen ritas, där medianen är utsatt med ett streck i lådan Streck från lådan till den minsta och största observationen dras Rita ett lådagram för följande observationer: 1, 2, 3, 3, 3, 4, 5, 6, 6, 7, 10, 11
28
Standardvägning En metod för att jämföra medelvärden för olika grupper där man tar hänsyn till att grupperna kan skilja sig åt i fördelningen för en annan variabel Exempel: Medellöner för män och kvinnor efter arbetslivserfarenhet på ett företag Enligt formel för vägt medelvärde får vi Känns denna jämförelse rättvis? Om vi i stället beräknar vägda medelvärden men använder totalantalet som vikter får vi Kvinnor Män Arbetserfarenhet Antal Medellön 10 år eller mer 18 28000 5 32000 5-9 år 15 26000 12 30000 2-4 år 10 23000 17 25000 0-1 år 8 20000 11
29
Sannolikhetsteori sid 47-78
Kapitel 3 Sannolikhetsteori sid 47-78
30
Mängdlära Används för att förstå och åskådliggöra sannolikheter
När vi utför ett experiment (slumpmässigt försök) kan vi få olika utfall Exempel på experiment: Kasta en tärning, kasta ett mynt, dra ett kort från en kortlek, välj slumpmässigt en person från en population och fråga om partisympati Vilka är de möjliga utfallen? S = utfallsrum = mängden av de olika utfallen En händelse definieras som en samling utfall Exempel: A = antal udda prickar vid tärningskast, B = antal prickar högst 2 vid tärningskast
31
Venndiagram Ett diagram som åskådliggör utfallsrum och olika händelser
32
Händelser Snitt Union Komplement till A Disjunkta händelser
Händelsen att både A och B inträffar Union Händelsen att antingen A eller B eller båda inträffar Komplement till A Händelsen att A inte inträffar Disjunkta händelser Händelserna A och B är disjunkta om de inte kan inträffa samtidigt (dvs de har inget snitt) Oberoende händelser Händelserna A och B är oberoende om sannolikheten att händelsen A inträffar inte påverkas av om B redan inträffat eller ej, samt sannolikheten att B inträffar inte påverkas av om A redan inträffat eller ej
33
Kombinatorik En metod för att bestämma antalet sätt ett visst antal element kan väljas/ordnas i mängder Multiplikationsprincipen Används när vi i tur och ordning ska utföra k stycken operationer där antalet möjliga händelser vid varje operation är n1, n2,…, nk Det totala antalet sätt att utföra k operationer är Exempel: På en restaurang kan man välja mellan två förrätter, tre huvudrätter, och två efterrätter. På hur många sätt kan man skapa sin trerätters måltid?
34
Permutationer när alla element är olika
Används när vi i en viss ordningsföljd vill välja ut k av n element och varje element endast får användas en gång Antalet permutationer när alla element är olika är Exempel: Av fyra längdskidåkare ska två väljas ut till ett stafettlag: en till förstasträckan och en till andrasträckan. På hur många sett kan detta ske?
35
Permutationer när vissa element är lika
Används när vi vill ordna n element och där k1 tillhör en typ, k2 tillhör en annan typ osv Antalet permutationer när vissa element är lika är Exempel: I ett längdskidåkningslag finns två kvinnliga juniorer, två manliga juniorer, en kvinnlig senior och en manlig senior. På hur många sätt kan vi bilda stafettlag med dessa sex åkare?
36
Kombinationer utan upprepning
Används när vi utan hänsyn till ordning vill välja ut k av n element och varje element endast får användas en gång Antalet kombinationer är Exempel: Av fyra längdskidåkare ska två väljas ut till ett stafettlag: På hur många sett kan detta ske?
37
Kombinationer vid upprepning
Används när vi utan hänsyn till ordning vill välja ut k av n element och varje element får användas flera gånger Antalet kombinationer är Exempel: I en affär finns 4 sorter med plockgodis. På hur många sätt kan vi välja 2 godisbitar?
38
Sannolikhetslära Område inom statistiken där vi arbetar med experiment vars utfall beror på slumpen Sannolikhet: ett värde som talar om hur troligt det är att en viss händelse ska inträffa Klassiska sannolikhetsdefinitionen Regler för sannolikheter: Sannolikheten för disjunkta händelser som upptar hela utfallsrummet kommer tillsammans att summera till 1
39
Relativ frekvens Sannolikheten för en händelse är en bedömning av den relativa frekvensen för händelsen
40
Räknemetoder för sannolikheter
Additionssatsen för disjunkta händelser För två händelser A och B som är disjunkta gäller att Additionssatsen för icke disjunkta händelser För två händelser A och B som inte är disjunkta gäller att Exempel: Vad är sannolikheten att få ett ess eller en kung när man drar ett kort ur en kortlek? Vad är sannolikheten att få ett ess eller ett hjärter när man drar ett kort ur en kortlek?
41
Multiplikationssatsen för oberoende händelser
Om händelserna A och B är oberoende gäller Om händelserna A och B inte är oberoende gäller Exempel: Vad är sannolikheten att få två sexor vid kast av två tärningar? Vad är sannolikheten att få två ess vid dragning av två kort från en kortlek? Vad är sannolikheten att kortet vi dragit är ett ess om vi vet att kortet är minst en dam?
42
Satsen om total sannolikhet
Om A1, A2, …, Ag är disjunkta händelser, sådana att deras union tillsammans bildar hela utfallsrummet, gäller Exempel: I en fabrik tillverkas 25% av enheterna av maskin A1, 35% av maskin A2, och 40% av maskin A3. Dessutom gäller att 5% som tillverkas i maskin A1 är defekta, 4% som tillverkas i maskin A2 är defekta, och 2% som tillverkas i maskin A3 är defekta. Vad är sannolikheten att en slumpmässigt vald enhet är defekt?
43
Bayes sats Om A1, A2, …, Ag är disjunkta händelser, sådana att deras union tillsammans bildar hela utfallsrummet, gäller Exempel (forts.): Vad är sannolikheten att en slumpmässigt vald enhet tillverkats av maskin A1 om vi vet att den är defekt?
Liknande presentationer
© 2024 SlidePlayer.se Inc.
All rights reserved.