Föreläsning 8 (Kajsa Fröjd) Logistisk regression Kap 17.1-17.2 Man har en binär responsvariabel som är relaterad till en/flera kvantitativa och/ eller.

Slides:



Advertisements
Liknande presentationer
Punkt- och intervallskattning Felmarginal
Advertisements

Icke-linjära modeller:
20 år med förändringar i skolan: Vad har hänt med likvärdigheten?
Kurs Fastighetsvärdering-massvärdering LTH Arne Sundquist
Samband mellan kvalitativa variabler Sid
Föreläsning 1.
FL10 732G81 Linköpings universitet.
FL9 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Kapitel 5 Stickprovsteori Sid
Linda Wänström och Elisabet Nikolic (Karl Wahlin)
Statsvetenskap 3, statsvetenskapliga metoder
Dette har skjett i tidigere episode:
Betydelsen av sociala jämförelser för anställdas stress och hälsa Tomas Berglund Sociologiska institutionen Göteborgs universitet.
732G22 Grunder i statistisk metodik
Out of home Jannike Sköldebjer MMS. Bakgrund People Meter-panelen mäter endast tittandet i hemmet. Gäster representerar panelmedlemmar som tittar i annans.
Robert Gidehag & Jonas Arnberg. Studiens frågeställningar Övergripande: Är den svenska alkoholpolitiken effektiv på 2000-talet?
Upplevelser och Uppfattningar om äldres läkemedelsanvändning - Att ha full koll eller bara gapa och svälja Sofia Björkdahl Handledare: Rebecka Arman,
Handledare: Rebecka Arman FoU i Väst
Workshop i statistik för medicinska bibliotekarier!
Tillämpad statistik Naprapathögskolan
Felkalkyl Ofta mäter man inte direkt den storhet som är den intressanta, utan en grundläggande variabel som sedan används för att beräkna det som man är.
Kvantitativ strategi viktiga begrepp 1
Skattningens medelfel
Uppföljning av implementering av Handlingsplan ökad patient-/brukarmedverkan
1 Föreläsning 5 Programmeringsteknik och Matlab 2D1312/2D1305 Repetition Metoder Array API och klassen ArrayList.
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
Fysikexperiment 5p Föreläsning Korrelationer Ett effektivt sätt att beskriva sambandet mellan två variabler (ett observationspar) är i.
Statsvetenskap 3, statsvetenskapliga metoder
Hur bra är modellen som vi har anpassat?
Logistisk regression SCB September 2004 Dan Hedlin, U/MET-S.
Regeringens arbetsmarknadsreformer och lönebildningen Lars Calmfors ABF, Göteborg 5/
Läkarprogrammet – Termin 5, VT 2015
Statistiska samband i trafikolyckor Av: Lina Forsberg Hangjin Lee Daniel Leo Carl-Mikael Westman.
Musikkompendium Test. Musikkompendium Test 2 Musikkompendium Test 3.
1 Stokastiska variabler. 2 Variabler En variabel är en egenskap hos en individ /objekt. En variabel kan, som vi tidigare sett, vara kvalitativ eller kvantitativ.
SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ Timmar/
Medicinsk statistik II Läkarprogrammet T5 HT 2013 Susann Ullén FoU-centrum Skåne Skånes Universitetssjukhus.
Statistik för AT-läkare Robert Hahn, Södertälje sjukhus.
Föreläsning 5 Kap 13 Tidsserier- vad är det? Trend/Säsong/Konjuktur/Slump Identifiering av trender (Glidande medelvärde) Säsongsmedelvärdesmetoden Säsongsdummymetoden.
Föreläsning 7 (Kajsa Fröjd) Korstabeller och Chi-tvåtest Kap 2.5, Man har två kvalitativa variabler som man vill gemensamt undersöka. 1.
1 Icke-linjär regression Sid (i kapitel 16.1)
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Föreläsning 4 (Kajsa Fröjd) Multipel regression Kap 11.3 A.Man har en kvantitativ responsvariabel som är linjärt relaterad till en/flera kvantitativa förklarande.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
En sak i taget 1. Mata in data 2. Förbered data för beräkningar 3. Beräkna 1. Börja med att testa din hypotes 2. Därefter titta på ev bakomliggande faktorer.
Kvantitativa forskningsmetoder Sociologi A VT 2015 Ilkka Henrik Mäkinen (momentansvarig)
1 Multipel Regression Kapitel Modell Vi har p oberoende variabler som vi tänker oss kan vara relaterade till den beroende variabeln. Y ~ N( , 
Föreläsning 5 (Kajsa Fröjd) Tidsserier Kap 13.1 Man har en kvantitativ responsvariabel som mäts vid olika tidpunkter. 1.
Föreläsning 7 (Kajsa Fröjd) Korstabeller och Chi-tvåtest Kap 2.5, Två/flera populationer och en kvalitativ variabel (”The first model” i Moore)
Korstabeller och logistisk regression Samband mellan kvalitativa variabler.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.
”Cognitive ability, alcohol use and alcohol-related harm” Sara Sjölund MD, PhD Dept. of Public Health Sciences, Karolinska Institutet Presentation av avhandling.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov Data, observationer.
Regression Har långa högre inkomst?. Världsrekord på engelska milen.
Samband & Inferens Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband mellan kvot-varibaler –Korrelationskoefficient.
Föreläsning 4 Kap 11.3 Icke-linjära modeller Indikatorvariabel (dummyvariabel) Interaktionsterm.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
INFERENS OCH SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ.
Från Kalix till Ystad observationer på folkbibliotek
Så tycker de äldre om äldreomsorgen 2016
Icke-linjära modeller:
Krupic F*, Rolfson O*, Nemes S#, Kärrholm J*
Multipel regression och att bygga (fungerande) modeller
Skyddsfaktorer Riskfaktorer Livsvillkor Levnadsvanor Hälsa Ekonomiska konsekvenser Vårdkontakter Jämställdhet Jämlikhet Skyddsfaktorer Riskfaktorer.
Trender och fluktuationer
Ekonomisk uppföljning hjälpmedel 2016
Häsokunskap 1 hösten 2008 Emelie Åhlberg.
Vuxenutbildning 2018 i Stockholms län
Den pedagogiska kulturen
SPOR Användarenkät 2018.
Presentationens avskrift:

Föreläsning 8 (Kajsa Fröjd) Logistisk regression Kap Man har en binär responsvariabel som är relaterad till en/flera kvantitativa och/ eller kvalitativa förklarande variabler. 1

Logistisk regression 2

Logistisk regression användbart! Logistisk regression har ökat dramatiskt de senaste 15 åren. Den är nu den dominerande formen av regressionsanalys inom sociologisk och statsvetenskaplig forskning (ty samhällsveten- skapliga data är ofta kvalitativa och kan göras binära genom att slå ihop klasser/nivåer). 3

Ex. Politikerförtroende Responsvariabel: Politikerförtroende (’stort förtroende’/’litet förtroende’) Förklarande variabler: Utbildning, kön och mellanmänsklig tillit. Ursprungligen hade responsvariabeln Politikerförtroende fyra klasser/nivåer: ’mycket stort förtroende’, ’ganska stort förtroende’, ’ganska litet förtroende’ och ’mycket litet förtroende’. För att responsvariabeln skulle bli binär så slog man ihop klasserna ’mycket stort förtroende och ganska stort förtroende’ (och kallade den ’stort förtroende’) samt klasserna ’ganska litet förtroende’ och ’mycket litet förtroende’ (och kallade den ’litet förtroende’). 4

Definitioner 5

Varför funkar inte linjär regression då responsvariabeln är binär? 6

Odds 7

En växt ger en grodd med 80% sannolikhet. Vad är oddset för en grodd? 8

En annan växt ger en grodd med 25% sannolikhet. Vad är oddset för en grodd? 9

Logistisk regressionsmodell 10

Logistisk regressionsfunktion 11

12

Oddskvot (Odds Ratio, OR) 13

Ex 1. Nya köp och tidigare inköp 14

Ex 1. Nya köp och tidigare inköp 15

Ex 1. Nya köp och tidigare inköp 16

Ex 1. Nya köp och tidigare inköp 17

Ex 1. Nya köp och tidigare inköp 18

Ex 2. Nya köp och tidigare inköp samt kundkort 19

Ex 2. Nya köp och tidigare inköp samt kundkort 20

Ex 1. Nya köp och tidigare inköp 21

Ex 1. Nya köp och tidigare inköp samt kundkort 22

Ex 1. Nya köp och tidigare inköp 23

Test av samband mellan responsvariabeln och (åtminstone en av) de förklarande variablerna 24

Test av samband mellan responsvariabeln och någon av de förklarande variablerna 25

Konfidensintervall för oddskvot 26

Ex 2. Nya inköp (forts.) 27

Vilket statistikverktyg? Fall 1. Känslor av värdefullhet. Man vill undersöka huruvida kön, ålder (år) samt fysisk närhet i barndomen och fysisk närhet som vuxen påverkar individers känslor av värdefullhet (’känner sig värdefull’/’känner sig inte värdefull’). 1.Enkel regression 2.Multipel regression 3.Tidsserier 4.Chi-två test 5.Logistisk regression 28

Vilket statistikverktyg? Fall 2. Pris på begagnade bilar. För en viss modell vill man undersöka hur priset påverkas av årsmodell, körsträcka samt utrustningsnivå (0=standard, 1=exklusiv utrustning). 1.Enkel regression 2.Multipel regression 3.Tidsserier 4.Chi-två test 5.Logistisk regression 29

Vilket statistikverktyg? Fall 3. Byte till insulinpump. I dagsläget finns det skillnader i andelen insulinpumpanvändare mellan olika patientgrupper och skillnader finns även i de olika gruppernas benägenhet att byta från andra insulinbehandlingar till insulinpump. Man är intresserad av hur patienters njurfunktion, kön, långtidsblodsocker, insulindos, diabetesduration och ålder påverkar sannolikheten att byta till insulinpump. 1.Enkel regression 2.Multipel regression 3.Tidsserier 4.Chi-två test 5.Logistisk regression 30

Vilket statistikverktyg? Fall 4. Incidenter i trafiken och däck. En bärgningsfirma noterar för varje incident under en vinter vilken sorts däck de förolyckade bilarna hade (dubbdäck, friktionsdäck eller sommardäck) samt vilket väglag det var (isgata, snömodd eller gott skick). Man är intresserad av att se om det finns något samband mellan typ av däck och väglag vid sådana incidenter. 1.Enkel regression 2.Multipel regression 3.Tidsserier 4.Chi-två test 5.Logistisk regression 31

Vilket statistikverktyg? Fall 5. Fondutveckling. En fonds utveckling noteras (mätt som en fondandels värde i kronor den sista december varje år). Man är intresserad av att göra en prognos över fondens värde år Enkel regression 2.Multipel regression 3.Tidsserier 4.Chi-två test 5.Logistisk regression 32

Vilket statistikverktyg? Fall 6. Hjärtinfarktsbehandling. Man vill undersöka huruvida patienter i riskzonen för hjärtinfarkt har nytta av behandling mot ilska/vrede. Man har ett stickprov på 20 personer som alla har haft en hjärtinfarkt. Tio av dem får en viss behandling mot ilska/vrede, resterande tio får inte det. Förutom denna behandling så mäter man även deras ångestnivå (mätt på en viss skala). Efter ett år noterar man vilka som har fått ännu en hjärtinfarkt. 1.Enkel regression 2.Multipel regression 3.Tidsserier 4.Chi-två test 5.Logistisk regression 33

Vilket statistikverktyg? Fall 7. Biointäkter. I en studie undersöktes tio Hollywoodfilmer (som alla var baserade på någon bok) för att se om det fanns något samband mellan biljettintäkter och produktionskostnader, marknadsföringskostnader och bokförsäljning. 1.Enkel regression 2.Multipel regression 3.Tidsserier 4.Chi-två test 5.Logistisk regression 34

Vilket statistikverktyg? Fall 8. Operationsmetod och smärta. För att mäta smärta används ofta VAS-skalan (visuell analog skala). Patienten graderar sin smärta längs en 10cm lång linje där 0 är ingen smärta och 10 värsta tänkbara smärta. Vid en studie mäter en kirurg smärtan med VAS-skalan hos 89 patienter efter en viss typ av operation, 42 är opererade med titthålskirurgi och resterande med traditionell kirurgi. Smärtan delas in i tre klasser: låg smärta (0-25mm), acceptabel smärta (26-74mm) samt hög smärta (75-100mm). Man är intresserad av om de två operationsmetoderna ger skillnad i smärta. 1.Enkel regression 2.Multipel regression 3.Tidsserier 4.Chi-två test 5.Logistisk regression 35