Logistisk regression SCB September 2004 Dan Hedlin, U/MET-S.

Slides:



Advertisements
Liknande presentationer
Klimatmodellering i perspektiv
Advertisements

Icke-linjära modeller:
1 Plan för ny panelmatris och större panel och hösten 2005 Presentation för Referensgruppen 22 juni 2005.
Point Estimation Dan Hedlin
Alternativa Vacciner Antiviraler
Förbättringsområde enligt handlingsplan: ___________________________________ Mål: ________________________________________ Aktivitet (åtgärd/förändring.
Könsorganen Puberteten Menstruation Befruktning Preventivmedel
Hushållstorleksutredningen, tester Pirjo Svedberg MMS.
Dette har skjett i tidigere episode:
Algebraiska uttryck Matematik 1.
INFÖR NATIONELLA PROVET
Jonny Karlsson INTRODUKTION TILL PROGRAMMERING Föreläsning 6 ( ) INNEHÅLL: -Mera om tabeller.
Rapport sept 2013 ”Kvalitetsstjärnan” Nationellt kvalitetsregister Del 2: Fokus på Stjärnvariabler I Del 1 undersöktes internt bortfall i Kvalitetsstjärnans.
Out of home Jannike Sköldebjer MMS. Bakgrund People Meter-panelen mäter endast tittandet i hemmet. Gäster representerar panelmedlemmar som tittar i annans.
Tillämpad statistik Naprapathögskolan
Vibeke Horstmann, Inst för hälsa, vård, samhälle, Centre for Ageing and Supportive Environments Jämförelse av två behandlingar.
Skattningens medelfel
Några ihopsamlade knep för att göra multiplikationen lättare.
Grundläggande programmering
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
Fysikexperiment 5p Föreläsning Korrelationer Ett effektivt sätt att beskriva sambandet mellan två variabler (ett observationspar) är i.
Skattning av trendkurvor/trendytor och förändringar över tiden Claudia von Brömssen SLU.
Projekt 5.3 Gilpins och Ayalas θ-logistiska modell A Course in Mathematical Modeling - Mooney & Swift.
Hur bra är modellen som vi har anpassat?
Kombinerade serie- och parallellnät
Matematisk statistik och signal-behandling - ESS011 Föreläsning 3 Igor Rychlik 2015 (baserat på föreläsningar av Jesper Rydén)
Exempel: Vad påverkar kostnaden för produktion av korrugerat papper, dvs sådant som ingår i wellpapp och kartonger? Amerikansk studie: Kostnaden kan förmodligen.
Några allmänna räkneregler för sannolikheter
Regressions- och tidsserieanalys
1 Om sambandet inte är linjärt? Om sambandet till en variabel inte är linjärt så kan vi inkludera ytterligare en term i regressionsmodellen I en modell.
Säsongrensning: Serien rensas från säsongkomponenten genom beräkning av centrerade och viktade glidande medelvärden (centered moving averages, CMA): där.
Statistiska samband i trafikolyckor Av: Lina Forsberg Hangjin Lee Daniel Leo Carl-Mikael Westman.
MATMAT02b – UPPGIFT 10 Pass VCP Certification
PPU December Diagram 01. Reporänta med osäkerhetsintervall Procent, kvartalsmedelvärden Källa: Riksbanken Anm. Osäkerhetsintervallet tar inte.
Musikkompendium Test. Musikkompendium Test 2 Musikkompendium Test 3.
1 Normalfördelningsmodellen. 2 En modell är en förenklad beskrivning av någon del av verkligheten. Beskrivningen måste vara relevant för det vi skall.
1 Stokastiska variabler. 2 Variabler En variabel är en egenskap hos en individ /objekt. En variabel kan, som vi tidigare sett, vara kvalitativ eller kvantitativ.
1 Dummyvariabler (se 15.7) Man stöter ofta på förklaringsvariabler där den skala som använts vid mätning ej ger intervall- eller kvotskala. Denna typ av.
Medicinsk statistik II Läkarprogrammet T5 HT 2013 Susann Ullén FoU-centrum Skåne Skånes Universitetssjukhus.
Statistik för AT-läkare Robert Hahn, Södertälje sjukhus.
Föreläsning 5 Kap 13 Tidsserier- vad är det? Trend/Säsong/Konjuktur/Slump Identifiering av trender (Glidande medelvärde) Säsongsmedelvärdesmetoden Säsongsdummymetoden.
Modell för konsumtionen i Sverige Från Baudins kompendium.
Föreläsning 7 (Kajsa Fröjd) Korstabeller och Chi-tvåtest Kap 2.5, Man har två kvalitativa variabler som man vill gemensamt undersöka. 1.
Introduktion. Exempel: Till ett försök med bantningsmedlet Bantomid anmälde sig 14 personer frivilligt, alla med övervikt. De delades slumpmässigt in.
Tjo! Lennarth och hans vänner kommer hjälpa oss så att du lär dig om decimaler, hur man förkortar bråk och om odds. Det här är Lennarth -> Det här är hans.
Deskription Normalfördelningsmodellen 1. 2 En modell är en förenklad beskrivning av någon del av verkligheten. Beskrivningen måste vara relevant för det.
Manada.se Kapitel 4 Ekvationer och formler. 4.1 Ekvationer och uttryck.
Föreläsning 4 (Kajsa Fröjd) Multipel regression Kap 11.3 A.Man har en kvantitativ responsvariabel som är linjärt relaterad till en/flera kvantitativa förklarande.
Föreläsning 8 (Kajsa Fröjd) Logistisk regression Kap Man har en binär responsvariabel som är relaterad till en/flera kvantitativa och/ eller.
Seniorer är en tillgång för kommunerna – även ekonomiskt Konferens om äldreomsorgen Tomelilla den 23 november Björn Sundström
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
En sak i taget 1. Mata in data 2. Förbered data för beräkningar 3. Beräkna 1. Börja med att testa din hypotes 2. Därefter titta på ev bakomliggande faktorer.
Kvantitativa forskningsmetoder Sociologi A VT 2015 Ilkka Henrik Mäkinen (momentansvarig)
1. Kontinuerliga variabler
1 Multipel Regression Kapitel Modell Vi har p oberoende variabler som vi tänker oss kan vara relaterade till den beroende variabeln. Y ~ N( , 
Föreläsning 7 (Kajsa Fröjd) Korstabeller och Chi-tvåtest Kap 2.5, Två/flera populationer och en kvalitativ variabel (”The first model” i Moore)
Korstabeller och logistisk regression Samband mellan kvalitativa variabler.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.
1 UNDERSÖKNINGSMETODIK Ett gemensamt syfte för alla undersökningar är att få ökad kunskap om ett visst problemområde Statistiska undersökningar kan vara.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov Data, observationer.
Regression Har långa högre inkomst?. Världsrekord på engelska milen.
Föreläsning 4 Kap 11.3 Icke-linjära modeller Indikatorvariabel (dummyvariabel) Interaktionsterm.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
Mål/delmål: ……..…………………………………………………..
Icke-linjära modeller:
Multipel regression och att bygga (fungerande) modeller
Relation mellan variabler – samvariation, korrelation, regression
Samband mellan ohälsa i munnen och MNA ≤ 7 – data från Senior alert Jan 2013 – Juli Dennis Nordvall Statistiker, Qulturum.
Grundläggande begrepp
Nyheter i modellsystemet Rapsdagen
Presentationens avskrift:

Logistisk regression SCB September 2004 Dan Hedlin, U/MET-S

Y-variabeln binär (0 eller 1) Rösta eller ej, få cancer eller ej, leva under eller över en fattigdomsgräns, bortfall (se CBM ’Estimation in the presence of nonresponse’, avsnitt 6.1) Vid vanlig linjär regression Y ej begränsad Knep: p är sannolikheten för cancer etc.

Alternativa uttrycksätt Vanlig beteckning Ekvivalent med

Olika skalor Log-odds (additiva effekter) Odds p/(1-p) (multiplikativa effekter) Sannolikhet Annan skillnad mot ’vanlig’ regression: Iterativa beräkningar och andra ev. beräkningsproblem

Tolkning av parametrarna ’Bas-sannolikhet’ för Kanske enklast att tolka i det fall x är intervall-variabler och nollpunkten är meningsfull

Tolkning av ß Modell med ’ett x’: Eller Additiv ökning av x med 1 steg motsvaras i denna modell med multiplikation av oddset med

Klassiskt exempel Bliss (1935), även i Agresti (1990) ’Catergorical Data Analysis’, Wiley, avsnitt Beetles, två intervall-variabler y = död/överlevt, x = log(dos koldisulfit) Finns andra modeller för binärt y som kan vara bättre. Logistisk reg dock vanligast.

Ca 1400 kvinnor i Uganda Självuppskattad risk för AIDS (hög/låg) Förklarande variabler bl.a. Ålder vid giftermål (alla ip har gift sig) Ålder vid sexdebut F.n. gift Har stadig partner Stad – landsbyggd Använder kondom

Modellbygge 1.Tabell låg-hög risk mot varje variabel för sig 2.Titta efter celler med nollor 3.Grovrens med t.ex. Forward selection och 25% signifikanstest 4.Testa var för sig 5.För kontinuerliga variabler: undersök linjäritet genom att kategorisera och beräkna log-odds inom kategorier 6.Prova samspelseffekter 7.Använd ämneskunskap och vett

Multiplikativ effekt Vad oddset för hög risk multipliceras med om förklarande variabel ökas med ett steg Ålder vid giftermål (5 års intervall) F.n. Ogift/GiftSamspel Har ej/Har partner Stad/Landsbyggd