Föreläsning 7 (Kajsa Fröjd) Korstabeller och Chi-tvåtest Kap 2.5, 9.1-9.2 1.Två/flera populationer och en kvalitativ variabel (”The first model” i Moore)

Slides:



Advertisements
Liknande presentationer
Punkt- och intervallskattning Felmarginal
Advertisements

Ett stickprov kvantitativa data: t-test
Inferens om en population Sid
F3 Matematikrep Summatecknet Potensräkning Logaritmer Kombinatorik.
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Samband mellan kvalitativa variabler Sid
Teori.
1 Exempel Man drar ett OSU om medlemmar ur en stor politiskt oberoende organisation, och frågar dels om kön, dels om politisk tillhörighet (vänster eller.
FL9 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Inferens om en ändlig population Sid
Grundläggande statstik, ht 09, AN1 F9 Analys av frekvenstabeller Hittills har vi analyserat eller jämfört 2 grupper avseende variabler på intervall- eller.
Statsvetenskap 3, statsvetenskapliga metoder
732G22 Grunder i statistisk metodik
FL2 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
Tillämpad statistik Naprapathögskolan
Chitvå-test Regression forts.
Lärare: Ann-Charlotte (Lotta) Hallberg
732G81 Statistik för internationella civilekonomer
Föreläsning 81 Sampling och urval Ofta möter vi påståenden av typen “4.5 miljoner svenskar såg VM-finalen i fotboll”, “en svensk tolvåring väger i genomsnitt.
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
Fysikexperiment 5p Föreläsning Korrelationer Ett effektivt sätt att beskriva sambandet mellan två variabler (ett observationspar) är i.
FL7 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Statsvetenskap 3, statsvetenskapliga metoder
Egenskaper för punktskattning
Multipel linjär regressionsanalys
Sannolikhet Stickprov Fördelningar
Föreläsning 7 Fysikexperiment 5p Poissonfördelningen Poissonfördelningen är en sannolikhetsfördelning för diskreta variabler som är mycket.
Hur bra är modellen som vi har anpassat?
Linjär regression föreläsning 9
Statistik Lars Valter Fil.lic. Statistik
Mål Matematiska modeller Biologi/Kemi Statistik Datorer
Några allmänna räkneregler för sannolikheter
1 Om sambandet inte är linjärt? Om sambandet till en variabel inte är linjärt så kan vi inkludera ytterligare en term i regressionsmodellen I en modell.
1 Fler uträkningar med normalfördelningstabell Låt X vara Nf(170,5). Beräkna Lösning:
Statistiska samband i trafikolyckor Av: Lina Forsberg Hangjin Lee Daniel Leo Carl-Mikael Westman.
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
Föreläsning 8 732G81. Kapitel 8 Inferens om en ändlig population Sid
SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ Timmar/
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
  2 f ( 2 ) Chi-Square Distribution: df=10, df=30, df=50 df = 10 df = 30 df = 50 Chi-2-fördelningen.
Föreläsning 7 (Kajsa Fröjd) Korstabeller och Chi-tvåtest Kap 2.5, Man har två kvalitativa variabler som man vill gemensamt undersöka. 1.
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Vad är Statistik? Inom statistik teorin studeras -Hur vi samlar in data. -Hur data analyseras och vilka slutsatser som kan dras från data. -Hur insamlad.
Föreläsning 4 (Kajsa Fröjd) Multipel regression Kap 11.3 A.Man har en kvantitativ responsvariabel som är linjärt relaterad till en/flera kvantitativa förklarande.
Föreläsning 8 (Kajsa Fröjd) Logistisk regression Kap Man har en binär responsvariabel som är relaterad till en/flera kvantitativa och/ eller.
Ligger kommunens kostnader ”rätt”?. Vem har dyrast äldreomsorg?
Samband mellan kvalitativa variabler Korstabeller Moore kapitel 2.5 och kapitel 9.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
Betingade sannolikheter. 2 Antag att vi kastar en tärning och noterar antalet prickar som kommer upp. Låt A vara händelsen ”udda antal prickar”, dvs.
Kvantitativa forskningsmetoder Sociologi A VT 2015 Ilkka Henrik Mäkinen (momentansvarig)
1. Kontinuerliga variabler
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
1 Multipel Regression Kapitel Modell Vi har p oberoende variabler som vi tänker oss kan vara relaterade till den beroende variabeln. Y ~ N( , 
Idag: Repetition av Chi2-test Kap 6*, Kodning av svaren Kap 10*, Olika feltyper Kap 12*, Rapportskrivning *Dahmström.
Korstabeller och logistisk regression Samband mellan kvalitativa variabler.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
Sannolikhet och statistik Tabell Används för att ge en bra överblick av svaren man fått in, datan. Består av rader och kolumner. Frekvens Är hur många.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov Data, observationer.
Samband & Inferens Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband mellan kvot-varibaler –Korrelationskoefficient.
Föreläsning 4 Kap 11.3 Icke-linjära modeller Indikatorvariabel (dummyvariabel) Interaktionsterm.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
INFERENS OCH SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ.
naaf. no/Documents/Allergi%20i%20Praksis/Aip4_06_Karelen
Relation mellan variabler – samvariation, korrelation, regression
Förelasning 1 Kursintroduktion Statistiska undersökningar
Det är eftermiddag och Wilma och Hugo har precis kommit hem ifrån skolan. De ska snart iväg till sin träning, men måste göra sin läxa först. – Vi måste.
Y 5.4 Tabeller och diagram Frekvens och relativ frekvens
Presentationens avskrift:

Föreläsning 7 (Kajsa Fröjd) Korstabeller och Chi-tvåtest Kap 2.5, Två/flera populationer och en kvalitativ variabel (”The first model” i Moore) 2.En population och två kvalitativa variabler (”The second model” i Moore) 1

Korstabeller 2

Exempel: Civilstånd/jobbnivå för män (s.151/-) Äktenskap är bra för karriären för män enligt vissa studier. Nedan finns data från en studie på 8235 män uppsatt i en korstabell. Civilstånd är förklarande variabel. Jobbnivå är respondvariabel. *Här är det en population (män) och två kvalitativa variabler (Jobbnivå och Civilstånd). När man konstruerar en korstabell bör: Den förklarande variabeln vara kolumnvariabel. Respondvariabeln vara radvariabel. Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt Totalt

Ange en lämplig korstabell Ex: A-vitamin och överlevnad (s.546/503) A-vitamin eller placebo gavs till barn (1-6 år) i ett U-land. Efter ett år hade 101 av dött i A-vitamingruppen och 130 av barn dött i placebogruppen. 1.Övre 2.Undre *Här är det två populationer (A-vitamin-barnen och placebo-barnen) och en kvalitativ variabel med två utfall (död/levande). DödLevandeTotalt Vitamin A Placebo Totalt Vitamin APlaceboTotalt Död Levande Totalt

Ange en lämplig korstabell Ex: Bakgrundsmusik och vinval (s.548/505 ) I en studie spelades antingen fransk dragspelsmusik, italiensk strängmusik eller ingen musik alls i en affär på Nordirland. Man registrerade antalet franska, italienska samt övriga viner som såldes vid de olika bakgrundsljuden. 1.Övre 2.Undre * Här är det tre populationer (ingen musik, fransk och italiensk) och en kvalitativ variabel (franskt vin/italienskt vin/övrigt). 5 Musik VinIngenFranskItalienskTotalt Franskt Italienskt Övrigt Totalt Vin MusikFransktItaliensktÖvrigtTotalt Ingen Fransk Italiensk Totalt

Marginalfördelning (s. 151/123) Marginalfördelningar kallas de enskilda fördelningarna för den förklarande variabeln och för respondvariabeln. Ex. 6 Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt Totalt

Vilken plot visar marginalfördelningen för hälsotillståndet efter ett år? 1.Den vänstra 2.Den högra Vitamin APlaceboTotalt Död Levande Totalt

Exempel: Civilstånd/jobbnivå för män Fråga: Beräkna marginalfördelningen för civilstånd. Lösn: Marginalfördelning för Civilstånd: % singlar: 337/8235 =0.041 % gifta: 7730/8235 = % skilda: 126/8235 = % änklingar: 42/8235 = Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt Totalt

Ange marginalfördelningen för bakgrundsmusik Ex: Bakgrundsmusik och vinval 1.Ingen musik: 30/84 Fransk musik: 39/75 Italiensk musik:30/84 2.Ingen musik: 84/243 Fransk musik: 75/243 Italiensk musik: 84/243 2.Ingen musik: 99/243 Fransk musik: 31/243 Italiensk musik: 113/243 9 Musik VinIngenFranskItalienskTotalt Franskt Italienskt Övrigt Totalt

Betingade fördelningar (s.154/126) Marginalfördelningar berättar om de kvalitativa variablerna men säger ingenting om deras samband till varandra. Betingade fördelningar är bra för att betrakta samband mellan de kvalitativa variablerna. De betingade fördelningarna för respondvariabeln givet de olika värdena på den förklarande variabeln är oftast de intressantaste. (Det finns naturligtvis även betingade fördelningar för den förklarande variabeln givet olika värden på responsvariabeln.) 10

Exempel på betingade fördelningar De fyra betingade för- delningarna för jobbnivå givet de fyra olika civilstånden ⇒ 11 Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt Totalt

Exempel: Civilstånd/jobbnivå för män Fråga: Ange den betingade fördelningen för jobbnivå givet att han är singel. Lösn: Den betingade fördelningen för jobbnivå givet att han är singel: % Jobbnivå 1|Singel: 58/337 = % Jobbnivå 2|Singel: 222/337 = % Jobbnivå 3|Singel: 50/337 = % Jobbnivå 4|Singel: 7/337 = Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt Totalt

Ange den betingade fördelningen för hälsotillståndet för barn som fick vitamin A 1.Död: 101/12 890, Levande: 101/ Död: 130/12 209, Levande: 130/ Död: 130/12 079, Levande: 120/ Död: 101/12 991, Levande: 12890/ Vitamin APlaceboTotalt Död Levande Totalt

Ange fördelningen för vinval för de som får höra på italiensk strängmusik 1.Franskt vin: 30/84, Italienskt: 11/84, Övr: 43/84 2.Franskt vin: 30/243, Italienskt: 19/243, Övr: 35/243 3.Franskt vin: 30/84, Italienskt: 19/84, Övr: 35/84 (Obs. Notera att orden ”den betingade givet” inte står med men att det är den som menas.) 14 Musik VinIngenFranskItalienskTotalt Franskt Italienskt Övrigt Totalt

Störande (lurking) variabler Man bör vara försiktig med vilka slutsatser man drar när man observerar statistiska samband mellan variabler. I extrema fall kan det samband man observerar vändas till det motsatta när man tar hänsyn till ytterligare variabler. Detta är Simpsons paradox. 15

Vilket sjukhus är det bättre? 16

Men om vi även vet om patientens tillstånd innan operationen... 17

Chi-två test (s.510/552) 18

Chi-två test versus ”vanligt” z-test för att testa om två proportioner är lika (s.545/502) 19

För Chi-två-testet behövs de förväntade frekvenserna under nollhypotesen 20 Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt Totalt

Ange det förväntade antalet överlevande barn efter ett år om de får placebo *2496/ *12209/ *130/ *24969/ Vitamin APlaceboTotalt Död Levande Totalt

Chi-två test 22

Exempel: Civilstånd/jobbnivå för män 23

24

25 Chi-Square Test: Singel; Gift; Skild; Änkling Expected counts are printed below observed counts Chi-Square contributions are printed below expected counts Singel Gift Skild Änkling Total ,08 896,44 14,61 4,87 9,158 0,562 0,010 2, , ,05 64,86 21,62 13,575 0,681 0,407 0, , ,30 38,10 12,70 26,432 1,474 0,441 0, ,55 517,21 8,43 2,81 10,722 0,482 0,243 0,504 Total Chi-Sq = 67,397; DF = 9; P-Value = 0,000 2 cells with expected counts less than 5.

Hur många frihetsgrader är det? 1.En 2.Två 3.Tre 4.Fyra 26

Gissa ifall det finns stöd för ett samband mellan A-vitamin och hälsotillstånd? 1.Ja 2.Nej 27 Vitamin APlaceboTotalt Död Levande Totalt

Finns det stöd på signifikansnivån 0.05 för ett samband mellan A-vitamin och hälsotillstånd? 1.Ja 2.Nej 3.Vet inte Chi-Square Test: Vitamin A; Placebo Expected counts are printed below observed counts Chi-Square contributions are printed below expected counts Vitamin A Placebo Total ,08 111,92 2,746 2, , ,08 0,025 0,027 Total Chi-Sq = 5,721; DF = 1; P-Value = 0,017 28

Tillräcklig stickprovsstorlek 29

Är stickprovet tillräckligt stort för att Chi- två testet ska vara lämpligt? 30 1.Ja 2.Nej 3.Vet inte

Är stickprovet tillräckligt stort för att Chi- två testet ska vara lämpligt? 1.Ja 2.Nej 3.Vet inte 31 Vitamin APlaceboTotalt Död Levande Totalt

Frivillig uppgift. Ex: Bakgrundsmusik och vinval Fråga: Testa om vinval har ett samband med bakgrundsmusik. Ange också om kriterierna är uppfyllda för att chi-två-testet ska vara lämpligt att använda. 32 Musik VinIngenFranskItalienskTotalt Franskt Italienskt Övrigt Totalt