732G70 Statistik A, 7hp Linda Wänström

Slides:



Advertisements
Liknande presentationer
Punkt- och intervallskattning Felmarginal
Advertisements

Inferens om en population Sid
F3 Matematikrep Summatecknet Potensräkning Logaritmer Kombinatorik.
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Exempel Utifrån medicinsk erfarenhet är 5% av befolkningen smittade av ett visst virus. Ett nytt test har visat sig ge 80% av de smittade korrekt diagnos.
Kapitel 2 – Hur ska en statistisk undersökning redovisas?
Statistikens grunder, 15p dagtid
FL3 732G81 Linköpings universitet.
FL8 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
FL9 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
FL5 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Inferens om en ändlig population Sid
Kapitel 5 Stickprovsteori Sid
FL2 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
F11 Olika urvalsmetoder, speciellt obundet slumpmässigt urval (OSU)
Workshop i statistik för medicinska bibliotekarier!
Kap 4 - Statistik.
Vad ingår kursen? i korta drag
Tillämpad statistik Naprapathögskolan
Grundlägande statistik,ht 09, AN1 F5 Kombinatorik (KW 1.6) Ex.: På en matsedel finns tre förrätter, två huvudrätter och två efterrätter. På hur många olika.
Sammanfatta siffrorna…
Skattningens medelfel
Statistik Tabeller och diagram.
Förelasning 1 Kursintroduktion Statistiska undersökningar
FK2002,FK2004 Föreläsning 2.
FL1 732G70 Statistik A Linköpings universitet.
732G81 Statistik Föreläsning 3 732G81 Statistik
FL7 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Binomialsannolikheter ritas i ett stolpdiagram
Föreläsning 5Forskningsmetodik 2005 Forskningsmetodik lektion 6.
Föreläsning 4: Sannolikhetslära
Sannolikhet Stickprov Fördelningar
Vara kommun Grundskoleundersökning 2014 Föräldrar 2 Levene skola årskurs 5 Antal svar 2014 för aktuell årskurs i skola: 12 Antal svar 2014 för årskurs.
732G22 Grunder i statistisk metodik
Matematisk statistik och signal-behandling - ESS011 Föreläsning 3 Igor Rychlik 2015 (baserat på föreläsningar av Jesper Rydén)
732G22 Grunder i statistisk metodik
Grundläggande statistik ht 09, AN
Matematisk statistik och signal-behandling - ESS011 Föreläsning 1 Igor Rychlik 2015 (baserat på föreläsningar av Jesper Rydén)
732G22 Grunder i statistisk metodik
Grundläggande statistik, ht 09, AN1 F6 Slumpmässigt urval 1. Population där X är diskret med fördelningen p(x). Medelvärdet μ och variansen σ². Observationer:
Lägesmått. Lägesmått Vad är lägesmått? Sammanfatta en mängd data Exempelvis hur mycket veckopengar får elever som går i åk7… En klass består av ca.
Föreläsning 1, Introduktion Varför statistik? Population – Urval - Mätnivå Deskription Cirkeldiagram, stapeldiagram, histogram, spridningsdiagram, boxplot…
1 Stokastiska variabler. 2 Variabler En variabel är en egenskap hos en individ /objekt. En variabel kan, som vi tidigare sett, vara kvalitativ eller kvantitativ.
Deskription + enkät Mätnivån styr hur man kan analysera data Tabeller – frekvenstabeller Diagram – cirkeldiagram, stapeldiagram, histogram, boxplot Beskrivande.
Deskription. Individer och variabler Individer, undersökningsobjekt – De vi undersöker. De vi gör mätningar på. Kan vara människor, men kan också vara.
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Vad är Statistik? Inom statistik teorin studeras -Hur vi samlar in data. -Hur data analyseras och vilka slutsatser som kan dras från data. -Hur insamlad.
Föreläsning 1-3 Introduktion till kursen Beskrivande statistik.
Deskription + enkät Mätnivån styr hur man kan analysera data Tabeller – frekvenstabeller Diagram – cirkeldiagram, stapeldiagram, histogram, boxplot Beskrivande.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
Betingade sannolikheter. 2 Antag att vi kastar en tärning och noterar antalet prickar som kommer upp. Låt A vara händelsen ”udda antal prickar”, dvs.
Diskreta slumpvariabler. Stokastiskvariabel En slumpvariabel (stokastisk variabel) är en Funktion eller regel som tilldelar ett tal till varje Utfall.
En sak i taget 1. Mata in data 2. Förbered data för beräkningar 3. Beräkna 1. Börja med att testa din hypotes 2. Därefter titta på ev bakomliggande faktorer.
1 Numeriska Deskriptiva Tekniker. 2 Centralmått §Vanligtvis fokuserar vi vår uppmärksamhet på två typer av mått när vi beskriver en population: l Centraläge.
Sannolikhet och statistik Tabell Används för att ge en bra överblick av svaren man fått in, datan. Består av rader och kolumner. Frekvens Är hur många.
DESKRIPTION Bearbeta, tolka och redovisa resultat. Vad ingår? Tabeller - Sammanfatta material Diagram - Åskådliggöra material Lägesmått - ”Genomsnitt”
Introduktion. 2 Vad är statistik? ”En massa siffror” Beskrivning av staten Metodlära.
Kap 4 - Statistik.
Marknadsundersökning Kap 12
Data och att presentera data
Förelasning 1 Kursintroduktion Statistiska undersökningar
Mer om repetionssatser och arrayer
Vad ingår kursen? i korta drag
Grundlägande statistik,ht 09, AN
Grundl. statistik F2, ht09, AN
KAP 5 – SANNOLIKHETSLÄRA OCH STATISTIK
STATISTIK OCH SANNOLIKHETER
Mängdlära Kombinatorik Sannolikhetsteori
Y 5.4 Tabeller och diagram Frekvens och relativ frekvens
Presentationens avskrift:

732G70 Statistik A, 7hp Linda Wänström (linda.wanstrom@liu.se) Tommy Schyman (tommy.schyman@liu.se)

Kursupplägg 10 föreläsningar 4 lektioner 4 räknestugor 3 datorövningar (labbar)

Kurslitteratur Tillämpad statistik – en grundkurs av Karl Wahlin Kurskompendium med extra övningsuppgifter Föreläsningsunderlag läggs ut på kurshemsidan senast kvällen innan föreläsningen.

Examination Skriftlig salstentamen den 16 april Hjälpmedel: Valfri miniräknare Kursboken Får innehålla markeringar och överstrykningar men inte anteckningar

Kurshemsida http://www.ida.liu.se/~732G70 Föreläsningsunderlag Schema med läsanvisningar Datorövningar Gruppindelning till datorövningar Kursplan Information http://www.ida.liu.se/~732G70

Populationer, stickprov och variabler Sid 11-46 Kapitel 2 Populationer, stickprov och variabler Sid 11-46

Population och stickprov Population: Den samling enheter (exempelvis individer) som vi vill dra slutsatser om Urvalsram En förteckning över populationens enheter Antalet enheter i populationen betecknas med N Stickprov: urval av enheter från populationen Antalet enheter i stickprovet betecknas med n Exempel Frågeställning: Hur skulle svenska folket rösta om det var val i dag? Population? Urvalsram? Stickprov?

Ändliga och oändliga populationer Oändlig population Sannolikheten att en enhet ska väljas ut ändras inte mellan dragningarna Oberoende mellan dragningarna Dragning med återläggning Ändlig population Sannolikheten att en enhet ska väljas ut ändras mellan dragningarna Ej oberoende mellan dragningarna Dragning utan återläggning Tumregel: populationen kan betraktas som oändlig om urvalet utgör mindre än 10% av populationsstorleken.

Variabel Variabel Kvalitativ variabel Kvantitativ variabel En egenskap som varierar Kvalitativ variabel Variabel som ej antar numeriska värden Kvantitativ variabel Variabel som antar numeriska värden Diskreta kvantitativa variabler Kan endast anta ett ändligt antal värden, eller ett oändligt men uppräkneligt antal värden Ofta heltalsvärden Kontinuerliga kvantitativa variabler Kan anta ett oändligt antal värden inom ett intervall

Skalor En variabel är mätt med en viss skala Nominalskala Ordinalskala Det går endast att kategorisera variabelvärdena Ordinalskala Det går att kategorisera OCH rangordna variabelvärdena Metrisk skala Det går att kategorisera och rangordna variabelvärdena, dessutom är avstånden mellan variabelvärdena desamma Exempel: Vilket parti skulle du rösta på om det var val i dag? __________ Hur gammal är du? ___________ Hur gammal är du? 18-25, 26-35, 36-64, 65+ Hur väl instämmer du i följande påstående: …. (håller helt med, håller delvis med, varken håller med eller tar avstånd, tar delvis avstånd, tar helt avstånd)?

Totalt antal röstberättigade Tabeller och diagram Med tabeller och diagram kan vi åskådliggöra fördelningen för en/flera variabler Tabell 2: Preliminärt röstberättigade svenska medborgare folkbokförda i Sverige vid riksdagsvalet 2014 efter valkrets, kön och ålder. Antal och procent Riksdagsvalkrets Antal Kvinnor Män Totalt antal röstberättigade   Procent 18-29 år 30-64 år 65- år Summa Hela riket 656 719 1 933 906 1 016 054 3 606 679 692 936 1 968 317 856 065 3 517 318 1 349 655 3 902 223 1 872 119 7 123 997 18,2 53,6 28,2 100 19,7 56,0 24,3 18,9 54,8 26,3 Stockholms kommun 64 276 193 712 72 468 330 456 60 713 193 905 53 695 308 313 124 989 387 617 126 163 638 769 19,5 58,6 21,9 62,9 17,4 19,6 60,7 19,8 Stockholms län 78 337 249 876 110 983 439 196 84 078 250 072 93 019 427 169 162 415 499 948 204 002 866 365 17,8 56,9 25,3 58,5 21,8 18,7 57,7 23,5 Uppsala län 28 153 68 785 33 409 130 347 28 629 68 899 29 034 126 562 56 782 137 684 62 443 256 909 21,6 52,8 25,6 22,6 54,4 22,9 22,1 Södermanlands län 17 209 54 276 32 404 103 889 18 562 54 990 27 927 101 479 35 771 109 266 60 331 205 368 16,6 52,2 31,2 18,3 54,2 27,5 53,2 29,4 Östergötlands län 31 817 86 256 47 857 165 930 35 343 89 822 40 323 165 488 67 160 176 078 88 180 331 418 19,2 52,0 28,8 21,4 54,3 24,4 20,3 53,1 26,6

Frekvenstabell Parti Andel(%) Socialdemokraterna 34.1 Vänsterpartiet En tabell som anger frekvens (absoluta och/eller relativa frekvenser) för varje variabelvärde Passar för kvalitativ variabel eller kvantitativ med få värden Exempel: ”Vilket parti skulle du rösta på i riksdagsvalet om det var val i dag?” Undersökning gjord av SIFO i mars 2014 Baserad på 1934 intervjuer Parti Andel(%) Socialdemokraterna 34.1 Vänsterpartiet 6.3 Miljöpartiet 10.1 Moderaterna 24.2 Centerpartiet 4.7 Folkpartiet 5.4 Kristdemokraterna Sverigedemokraterna 8.0 Övriga 2.5 Totalt 100

Stapeldiagram På x-axeln har vi de olika variabelvärdena På y-axeln har vi frekvenserna ( i detta fall procent) Passar för kvalitativ variabel

Cirkeldiagram Passar för kvalitativ variabel

Stolpdiagram Som stapeldiagram, men stolparna är tunnare Passar kvantitativ diskret variabel med få värden Exempel: Antal barn i ett stickprov med 3340 kvinnor i USA

Histogram Passar kvantitativa kontinuerliga variabler Variabelvärdena måste först klassindelas Exempel: Hushållsinkomst för de amerikanska kvinnorna (från tidigare)

Histogram Urval av hushållsinkomster (i dollar): 100, 300, 600, 800, 2000, 2100, 2100, 2200, 2500, 2700, 2800, 2900, 3000, 3100, 3200, 3300, 3500, 4000, 4800, 5500 Klassindela på ett rimligt sätt, exempelvis: 0-999, 1000-1999, 2000-2999, 3000-3999, 4000-4999, 5000-5999

Stam- och bladdiagram Ett slags histogram som står upp, där varje värde åskådliggörs Passar kvantitativa (både diskreta och kontinuerliga) variabler Siffrorna delas upp i ”stam” och ”blad” Exempel (forts): 100, 300, 600, 800, 2000, 2100, 2100, 2200, 2500, 2700, 2800, 2900, 3000, 3100, 3200, 3300, 3500, 4000, 4800, 5500 Stam: 1000-tal, dvs 0, 1, 2, 3, 4, 5

Beskrivande mått Andel/proportion (lägesmått) För kvalitativa eller kvantitativa variabler För stickprov: För population: Exempel: I SIFOS urval (i mars 2014) svarade 659 av1934 att de skulle rösta på socialdemokraterna om det var val i dag.

Typvärde (lägesmått) Variabelvärdet som förekommer med högst frekvens För kvalitativa eller kvantitativa variabler Exempel: Vad är typvärdet för antal barn för de amerikanska kvinnorna (från tidigare)? Vad är typvärdet för partisympati enligt SIFOs undersöknining?

(Aritmetiskt) medelvärde (lägesmått) För kvantitativa variabler För stickprov: För population: Exempel: Vad är medelvärdet för urvalet av inkomster?

Vägt medelvärde (lägesmått) Medelvärde för grupperade (klassindelade) data i en frekvenstabell För stickprov För population där g är antal grupper/klasser Vad blir medelvärdet för klassindelade inkomsten?

Median (lägesmått) Det mittersta värdet i en fördelning, när alla värden har storleksordnats För kvantitativa och kvalitativa variabler på minst ordinaldatanivå Medianen, M, har position Vad är medianinkomsten (för icke-klassindelade data)?

Varians och standardavvikelse (spridningsmått) Mäter ”spridningen” av data runt medelvärdet För kvantitativa variabler För stickprov För population Vad är standardavvikelsen för inkomsterna?

Varians och standardavvikelse (spridningsmått) Varians och standardavvikelse för grupperade/klassindelade data i en frekvenstabell För stickprov För population Vad är standardavvikelsen för de klassindelade inkomsterna?

Kvartilavstånd (spridningsmått) För kvantitativa variabler q3-q1 där q1 (första kvartilen) är mittersta värdet i första halvan av data q3 (tredje kvartilen) är mittersta värdet i andra halvan av data Kvartiler kan även beräknas på kvalitativa variabler på ordinaldatanivå

Lådagram Ett diagram som använder sig av median och kvartiler En låda som begränsas av första och tredje kvartilen ritas, där medianen är utsatt med ett streck i lådan Streck från lådan till den minsta och största observationen dras Rita ett lådagram för följande observationer: 1, 2, 3, 3, 3, 4, 5, 6, 6, 7, 10, 11

Standardvägning En metod för att jämföra medelvärden för olika grupper där man tar hänsyn till att grupperna kan skilja sig åt i fördelningen för en annan variabel Exempel: Medellöner för män och kvinnor efter arbetslivserfarenhet på ett företag Enligt formel för vägt medelvärde får vi Känns denna jämförelse rättvis? Om vi i stället beräknar vägda medelvärden men använder totalantalet som vikter får vi   Kvinnor Män Arbetserfarenhet Antal Medellön 10 år eller mer 18 28000 5 32000 5-9 år 15 26000 12 30000 2-4 år 10 23000 17 25000 0-1 år 8 20000 11

Sannolikhetsteori sid 47-78 Kapitel 3 Sannolikhetsteori sid 47-78

Mängdlära Används för att förstå och åskådliggöra sannolikheter När vi utför ett experiment (slumpmässigt försök) kan vi få olika utfall Exempel på experiment: Kasta en tärning, kasta ett mynt, dra ett kort från en kortlek, välj slumpmässigt en person från en population och fråga om partisympati Vilka är de möjliga utfallen? S = utfallsrum = mängden av de olika utfallen En händelse definieras som en samling utfall Exempel: A = antal udda prickar vid tärningskast, B = antal prickar högst 2 vid tärningskast

Venndiagram Ett diagram som åskådliggör utfallsrum och olika händelser

Händelser Snitt Union Komplement till A Disjunkta händelser Händelsen att både A och B inträffar Union Händelsen att antingen A eller B eller båda inträffar Komplement till A Händelsen att A inte inträffar Disjunkta händelser Händelserna A och B är disjunkta om de inte kan inträffa samtidigt (dvs de har inget snitt) Oberoende händelser Händelserna A och B är oberoende om sannolikheten att händelsen A inträffar inte påverkas av om B redan inträffat eller ej, samt sannolikheten att B inträffar inte påverkas av om A redan inträffat eller ej

Kombinatorik En metod för att bestämma antalet sätt ett visst antal element kan väljas/ordnas i mängder Multiplikationsprincipen Används när vi i tur och ordning ska utföra k stycken operationer där antalet möjliga händelser vid varje operation är n1, n2,…, nk Det totala antalet sätt att utföra k operationer är Exempel: På en restaurang kan man välja mellan två förrätter, tre huvudrätter, och två efterrätter. På hur många sätt kan man skapa sin trerätters måltid?

Permutationer när alla element är olika Används när vi i en viss ordningsföljd vill välja ut k av n element och varje element endast får användas en gång Antalet permutationer när alla element är olika är Exempel: Av fyra längdskidåkare ska två väljas ut till ett stafettlag: en till förstasträckan och en till andrasträckan. På hur många sett kan detta ske?

Permutationer när vissa element är lika Används när vi vill ordna n element och där k1 tillhör en typ, k2 tillhör en annan typ osv Antalet permutationer när vissa element är lika är Exempel: I ett längdskidåkningslag finns två kvinnliga juniorer, två manliga juniorer, en kvinnlig senior och en manlig senior. På hur många sätt kan vi bilda stafettlag med dessa sex åkare?

Kombinationer utan upprepning Används när vi utan hänsyn till ordning vill välja ut k av n element och varje element endast får användas en gång Antalet kombinationer är Exempel: Av fyra längdskidåkare ska två väljas ut till ett stafettlag: På hur många sett kan detta ske?

Kombinationer vid upprepning Används när vi utan hänsyn till ordning vill välja ut k av n element och varje element får användas flera gånger Antalet kombinationer är Exempel: I en affär finns 4 sorter med plockgodis. På hur många sätt kan vi välja 2 godisbitar?

Sannolikhetslära Område inom statistiken där vi arbetar med experiment vars utfall beror på slumpen Sannolikhet: ett värde som talar om hur troligt det är att en viss händelse ska inträffa Klassiska sannolikhetsdefinitionen Regler för sannolikheter: Sannolikheten för disjunkta händelser som upptar hela utfallsrummet kommer tillsammans att summera till 1

Relativ frekvens Sannolikheten för en händelse är en bedömning av den relativa frekvensen för händelsen

Räknemetoder för sannolikheter Additionssatsen för disjunkta händelser För två händelser A och B som är disjunkta gäller att Additionssatsen för icke disjunkta händelser För två händelser A och B som inte är disjunkta gäller att Exempel: Vad är sannolikheten att få ett ess eller en kung när man drar ett kort ur en kortlek? Vad är sannolikheten att få ett ess eller ett hjärter när man drar ett kort ur en kortlek?

Multiplikationssatsen för oberoende händelser Om händelserna A och B är oberoende gäller Om händelserna A och B inte är oberoende gäller Exempel: Vad är sannolikheten att få två sexor vid kast av två tärningar? Vad är sannolikheten att få två ess vid dragning av två kort från en kortlek? Vad är sannolikheten att kortet vi dragit är ett ess om vi vet att kortet är minst en dam?

Satsen om total sannolikhet Om A1, A2, …, Ag är disjunkta händelser, sådana att deras union tillsammans bildar hela utfallsrummet, gäller Exempel: I en fabrik tillverkas 25% av enheterna av maskin A1, 35% av maskin A2, och 40% av maskin A3. Dessutom gäller att 5% som tillverkas i maskin A1 är defekta, 4% som tillverkas i maskin A2 är defekta, och 2% som tillverkas i maskin A3 är defekta. Vad är sannolikheten att en slumpmässigt vald enhet är defekt?

Bayes sats Om A1, A2, …, Ag är disjunkta händelser, sådana att deras union tillsammans bildar hela utfallsrummet, gäller Exempel (forts.): Vad är sannolikheten att en slumpmässigt vald enhet tillverkats av maskin A1 om vi vet att den är defekt?