Föreläsning 7 (Kajsa Fröjd) Korstabeller och Chi-tvåtest Kap 2.5, 9.1-9.2 Man har två kvalitativa variabler som man vill gemensamt undersöka. 1.

Slides:



Advertisements
Liknande presentationer
Punkt- och intervallskattning Felmarginal
Advertisements

Inferens om en population Sid
Funktioner och programorganisation
Samband mellan kvalitativa variabler Sid
P-uppgiften: regler, planering och specifikation
1 Exempel Man drar ett OSU om medlemmar ur en stor politiskt oberoende organisation, och frågar dels om kön, dels om politisk tillhörighet (vänster eller.
732G22 Grunder i statistisk metodik
FL9 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Inferens om en ändlig population Sid
Grundläggande statstik, ht 09, AN1 F9 Analys av frekvenstabeller Hittills har vi analyserat eller jämfört 2 grupper avseende variabler på intervall- eller.
732G22 Grunder i statistisk metodik
FL2 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
Chitvå-test Regression forts.
Lärare: Ann-Charlotte (Lotta) Hallberg
732G81 Statistik för internationella civilekonomer
FL1 732G70 Statistik A Linköpings universitet.
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
Fysikexperiment 5p Föreläsning Korrelationer Ett effektivt sätt att beskriva sambandet mellan två variabler (ett observationspar) är i.
FL7 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Binomialsannolikheter ritas i ett stolpdiagram
Statsvetenskap 3, statsvetenskapliga metoder
Egenskaper för punktskattning
Sannolikhet Stickprov Fördelningar
Föreläsning 7 Fysikexperiment 5p Poissonfördelningen Poissonfördelningen är en sannolikhetsfördelning för diskreta variabler som är mycket.
Hur bra är modellen som vi har anpassat?
Linjär regression föreläsning 9
Logistisk regression SCB September 2004 Dan Hedlin, U/MET-S.
Statistik Lars Valter Fil.lic. Statistik
Mål Matematiska modeller Biologi/Kemi Statistik Datorer
Några allmänna räkneregler för sannolikheter
1 Om sambandet inte är linjärt? Om sambandet till en variabel inte är linjärt så kan vi inkludera ytterligare en term i regressionsmodellen I en modell.
Statistiska samband i trafikolyckor Av: Lina Forsberg Hangjin Lee Daniel Leo Carl-Mikael Westman.
Musikkompendium Test. Musikkompendium Test 2 Musikkompendium Test 3.
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
Föreläsning 8 732G81. Kapitel 8 Inferens om en ändlig population Sid
1 Stokastiska variabler. 2 Variabler En variabel är en egenskap hos en individ /objekt. En variabel kan, som vi tidigare sett, vara kvalitativ eller kvantitativ.
SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ Timmar/
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
  2 f ( 2 ) Chi-Square Distribution: df=10, df=30, df=50 df = 10 df = 30 df = 50 Chi-2-fördelningen.
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Manada.se Kapitel 4 Ekvationer och formler. 4.1 Ekvationer och uttryck.
Föreläsning 4 (Kajsa Fröjd) Multipel regression Kap 11.3 A.Man har en kvantitativ responsvariabel som är linjärt relaterad till en/flera kvantitativa förklarande.
Föreläsning 8 (Kajsa Fröjd) Logistisk regression Kap Man har en binär responsvariabel som är relaterad till en/flera kvantitativa och/ eller.
Ligger kommunens kostnader ”rätt”?. Vem har dyrast äldreomsorg?
Samband mellan kvalitativa variabler Korstabeller Moore kapitel 2.5 och kapitel 9.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
Kvantitativa forskningsmetoder Sociologi A VT 2015 Ilkka Henrik Mäkinen (momentansvarig)
1. Kontinuerliga variabler
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
Hypotesprövning. Statistisk hypotesprövning och hypotetisk-deduktiv metod Hypotetisk-deduktiv metod: –Hypotes: Alla svanar är vita. –Empirisk konsekvens:
1 Multipel Regression Kapitel Modell Vi har p oberoende variabler som vi tänker oss kan vara relaterade till den beroende variabeln. Y ~ N( , 
Föreläsning 7 (Kajsa Fröjd) Korstabeller och Chi-tvåtest Kap 2.5, Två/flera populationer och en kvalitativ variabel (”The first model” i Moore)
Korstabeller och logistisk regression Samband mellan kvalitativa variabler.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov Data, observationer.
Samband & Inferens Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband mellan kvot-varibaler –Korrelationskoefficient.
Föreläsning 4 Kap 11.3 Icke-linjära modeller Indikatorvariabel (dummyvariabel) Interaktionsterm.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
INFERENS OCH SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ.
Förelasning 1 Kursintroduktion Statistiska undersökningar
1 1.
Bostadstillägg Pensionsmyndigheten har av regeringen fått uppdraget att öka kunskapen om bostadstillägg och verka för att mörkertalet inom bostadstillägg.
Utvidgad uppföljning i Primärvården Förstärkt vårdgaranti
Kvalitetsenkäten för studerande mäter folkbildningskvalitet på fyra områden Redovisningen återspeglar de fyra perspektiven som ingår i enkäterna: deltagarnas.
Bostadstillägg Pensionsmyndigheten har av regeringen fått uppdraget att öka kunskapen om bostadstillägg och verka för att mörkertalet inom bostadstillägg.
Kvalitetsenkäten för studerande mäter folkbildningskvalitet på fyra områden Redovisningen återspeglar de fyra perspektiven som ingår i enkäterna: deltagarnas.
Y 5.4 Tabeller och diagram Frekvens och relativ frekvens
Presentationens avskrift:

Föreläsning 7 (Kajsa Fröjd) Korstabeller och Chi-tvåtest Kap 2.5, Man har två kvalitativa variabler som man vill gemensamt undersöka. 1

Korstabell Förklarande variabeln som kolumnvariabel. Respondvariabeln som radvariabel. Ex. (s.151) Äktenskap är bra för karriären för män enligt vissa studier. Nedan finns data från en studie på 8235 män som stödjer det påståendet. Civilstånd är förklarande variabel. Jobbnivå är respondvariabel. Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt Totalt

Vilken korstabell är lämplig? A-vitamin eller placebo gavs till barn (1-6 år) i ett U-land. Efter ett år hade 101 av dött i A-vitamingruppen och 130 av barn dött i placebogruppen. 1.Övre 2.Undre DödLevandeTotalt Vitamin A Placebo Totalt Vitamin APlaceboTotalt Död Levande Totalt

Marginalfördelning Marginalfördelningar kallas de enskilda fördelningarna för den förklarande variabeln och för respondvariabeln. Ex. 4 Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt Totalt

Vilket bild visar marginalfördelningen för hälsotillståndet efter ett år? 1.Den vänstra 2.Den högra Vitamin APlaceboTotalt Död Levande Totalt

Beräkning av marginalfördelning Marginalfördelning för Civilstånd: % singlar: 337/8235=0.041 % gifta: 7730/8235=0.939 % skilda: 126/8235=0.015 % änklingar: 42/8235= Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt Totalt

Betingade fördelningar Marginalfördelningar berättar om de kvalitativa variablerna men säger ingenting om deras samband tillvarandra. Betingade fördelningar är bra för att betrakta samband mellan de kvalitativa variablerna. 7

Beräkning av betingad fördelning Ange den betingade fördelningen för jobbnivå för en man som är singel. % Jobbnivå 1|Singel: 58/337 = % Jobbnivå 2|Singel: 222/337 = % Jobbnivå 3|Singel: 50/337 = % Jobbnivå 4|Singel: 7/337 = Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt Totalt

Betingade fördelningar De fyra betingade fördelningarna för jobbnivå givet mannens civilstånd är: 9

Betingad fördelning De betingade fördelningarna för den förklarande variabeln givet de olika värdena på respondvariabeln är oftast de intressantaste (dvs de vi har betraktat i exemplen). (Det finns naturligtvis även betingade fördelningar för respondvariabeln givet olika värden på förklaringsvariabeln.) 10

Vilket är den betingade fördelningen för hälso- tillståndet för barn som fick vitamin A? 1.101/12 890, 101/ /12 209, 130/ /12 079, 120/ /12 991, 12890/ Vitamin APlaceboTotalt Död Levande Totalt

Störande (lurking) variabler Man bör vara försiktig med vilka slutsatser man drar när man observerar statistiska samband mellan variabler. I extrema fall kan det samband man observerar vändas till det motsatta när man tar hänsyn till ytterligare variabler. Detta är Simpsons paradox. 12

Vilket sjukhus är det bättre? 13

Men om vi även vet om patientens tillstånd innan operationen... 14

Chi-två test kan användas för att: 15

Chi-två test för att testa samband mellan två kvalitativa variabler 16

Förväntade frekvenser under nollhypotesen 17 Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt Totalt

Vad är det förväntade antalet levande barn efter ett år, givet att de får placebo? *2496/ *12209/ *130/ *24969/ Vitamin APlaceboTotalt Död Levande Totalt

Chi-två test 19

Vi testar om det finns något samband mellan civilstånd och jobbnivå. 20

Forts... 21

22 Chi-Square Test: Singel; Gift; Skild; Änkling Expected counts are printed below observed counts Chi-Square contributions are printed below expected counts Singel Gift Skild Änkling Total ,08 896,44 14,61 4,87 9,158 0,562 0,010 2, , ,05 64,86 21,62 13,575 0,681 0,407 0, , ,30 38,10 12,70 26,432 1,474 0,441 0, ,55 517,21 8,43 2,81 10,722 0,482 0,243 0,504 Total Chi-Sq = 67,397; DF = 9; P-Value = 0,000 2 cells with expected counts less than 5.

Hur många frihetsgrader är det? 1.En 2.Två 3.Tre 4.Fyra 23

Gissa ifall det finns stöd för ett samband mellan A-vitamin och hälsotillstånd? 1.Ja 2.Nej 24 Vitamin APlaceboTotalt Död Levande Totalt

Finns det stöd på signifikansnivån 0.05 för ett samband mellan A-vitamin och hälsotillstånd? 1.Ja 2.Nej 3.Vet inte Chi-Square Test: Vitamin A; Placebo Expected counts are printed below observed counts Chi-Square contributions are printed below expected counts Vitamin A Placebo Total ,08 111,92 2,746 2, , ,08 0,025 0,027 Total Chi-Sq = 5,721; DF = 1; P-Value = 0,017 25

Tillräcklig stickprovsstorlek 26

Är stickprovet tillräckligt stort för att Chi-två testet ska vara lämpligt? 27 1.Ja 2.Nej 3.Vet inte

Är stickprovet tillräckligt stort för att Chi-två testet ska vara lämpligt? 1.Ja 2.Nej 3.Vet inte 28 Vitamin APlaceboTotalt Död Levande Totalt