Validering av Cox-modellen

Slides:



Advertisements
Liknande presentationer
Punkt- och intervallskattning Felmarginal
Advertisements

Bedömning av uppfyllelse av miljökvalitetsnormer
Talföljder formler och summor
Förskolor och skolor i Nacka – i en klass för sig
Skapa ett video-CV på YouTube
Vad är feedback? Vad ska jag tänka på för att feedback ska bidra till studentens lärande?
Skriv text i punktlistor och ändra bildlayout
Matematik med föräldrar
F3 Matematikrep Summatecknet Potensräkning Logaritmer Kombinatorik.
Bidrar en integrerad vårdmodell till personcentrerad vård ? sjuksköterskors erfarenheter från en onkologisk klinik Anki Delin Eriksson.
Ungas frågor om alkohol och droger
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Klusterurval, forts..
- Konsten att ge feed-back
Att skriva en artikel.
Instruktioner Vilken grupp av frågor känner du att du instämmer mest med? Instämmer du i hög grad med de första 10 frågorna är din självkänsla lägre.
Mannitoltest Vid frågor ring Peter Josefsson , alt.
Konsten att leda sig själv
Studenter Lär Av Studenter ”SLAS”
FL3 732G81 Linköpings universitet.
Passion, Samhörighet och Kärlek
FL8 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Kapitel 5 Stickprovsteori Sid
Patientsäkerhetsronder
K ALLE K ARLSSON IUP vt J AG GÅR I SKOLAN FÖR ATT …
Förskolor och skolor i Nacka – i en klass för sig Gymnasieutbildning Kvalitetsredovisning för förskoleverksamhet och utbildning i Nacka kommun år 2008,
Vad är du för typ av person?
Rapport sept 2013 ”Kvalitetsstjärnan” Nationellt kvalitetsregister Del 2: Fokus på Stjärnvariabler I Del 1 undersöktes internt bortfall i Kvalitetsstjärnans.
Och bedömningen av laborationen Vad ska vi lära oss?
Algebra och ekvationer
Max start-guide Liten och väldigt snabbt ihopkastad.
Procent.
Att upptäcka matematiken med symbolhanterande räknare biennetten 2005 Patrik Erixon.
Felkalkyl Ofta mäter man inte direkt den storhet som är den intressanta, utan en grundläggande variabel som sedan används för att beräkna det som man är.
MG Production Den 75-årige Stig besöker sin läkare för att få sin sperma undersökt !
Bedömning Strategi 2 Tillfälle 4 1 Att ta fram belägg för elevers prestationer Att åstadkomma effektiva klassrumsdiskussioner, aktiviteter och.
Grundläggande programmering
Experimentell utvärdering Språkteknologisk forskning och utveckling (HT 2006)
Hur man lär sig saker på bästa sätt!
Jonny Karlsson INTRODUKTION TILL PROGRAMMERING Föreläsning 8 ( ) INNEHÅLL:Klasser: -Konstruktorer -Klassvariabler -Instansmetoder -Privata.
Förelasning 6 Hypotesprövning
Centrala Gränsvärdessatsen:
Fysikexperiment 5p Föreläsning Korrelationer Ett effektivt sätt att beskriva sambandet mellan två variabler (ett observationspar) är i.
Egenskaper för punktskattning
Naturvetenskaplig undersökning
Föreläsning 7 Fysikexperiment 5p Poissonfördelningen Poissonfördelningen är en sannolikhetsfördelning för diskreta variabler som är mycket.
Hur bra är modellen som vi har anpassat?
Att Skapa Serier.
Vad är en KATA? katatogrow.com.
Livsfrågor Vad är meningen med livet? Vem är jag egentligen?
SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ Timmar/
Medicinsk statistik II Läkarprogrammet T5 HT 2013 Susann Ullén FoU-centrum Skåne Skånes Universitetssjukhus.
Modell för konsumtionen i Sverige Från Baudins kompendium.
1 Icke-linjär regression Sid (i kapitel 16.1)
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
Betingade sannolikheter. 2 Antag att vi kastar en tärning och noterar antalet prickar som kommer upp. Låt A vara händelsen ”udda antal prickar”, dvs.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
1 Multipel Regression Kapitel Modell Vi har p oberoende variabler som vi tänker oss kan vara relaterade till den beroende variabeln. Y ~ N( , 
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov Data, observationer.
Regression Har långa högre inkomst?. Världsrekord på engelska milen.
Föreläsning 4 Kap 11.3 Icke-linjära modeller Indikatorvariabel (dummyvariabel) Interaktionsterm.
INFERENS OCH SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ.
Multipel regression och att bygga (fungerande) modeller
Trender och fluktuationer
Samband mellan ohälsa i munnen och MNA ≤ 7 – data från Senior alert Jan 2013 – Juli Dennis Nordvall Statistiker, Qulturum.
Ett verktyg för systematisk uppföljning i missbruksbruksvården
Presentationens avskrift:

Validering av Cox-modellen Oskar Hagberg, onkologiskt centrum, 2011-12-07

Färdplan Jag koncentrerar mig på Cox-modellen. Resonemanget kan ofta generaliseras om så önskas. Cox-modellen växer naturligt fram ur lograngtestet. För att poängerna skall gå fram repeteras Cox-modellen. Jag ser närmre på tre metoder: Cox-Snell-, Schönfeld- och Martingal-residualer. Några vinkar om hur man rent praktiskt gör i R ges också.

Två exempel

Artscan I: huvud-hals Baseline: Larynx

Slutsats Hypopharinx är värst, sedan Oris, Larynx och, lindrigast, Oropharynx Slutsatsen bygger på Coxregression. Coxregression bygger på antagandet om proportionella hasarder (PH). Hur kontrollerar jag det antagandet?

Validering, nivå 0 (artscan I)

Validering, nivå 1, kontrollera PH!

Pågående registerstudie

Kön tillför ingenting

Att kategorisera proI tillför ingenting

Alltså är följande sant???

Önskas: bättre validering Skall fungera även då antalet möjliga kovariat-kombinationer är stort – eller när några kovariater är kontinuerliga. Skall ge en vink om var felet ligger. Skall visa i vilken riktning man går för att förbättra.

Innan vi går vidare: repetition av Cox 𝜆 𝑡,𝑥 = 𝜆 0 𝑡 exp 𝛽 𝑇 𝑥 : hasard 𝐻 𝑡,𝑥 = 0 𝑡 𝜆 𝑠 𝑑𝑠 = exp 𝛽 𝑇 𝑥 𝐻 0 𝑡 : kumulerad hasard 𝑆 𝑡,𝑥 = exp −𝐻 𝑡,𝑥 = 𝑆 0 𝑡 exp 𝛽 𝑇 𝑥 𝑖 :överlevnadsfkn Men låt oss börja med lograngtestet!

Kontrollerna tycks dö tidigare – signifikant tidigare?

Lograngtestet av A (stand.) mot B (exp.) (ignorera ”ties”) Tänk under nollhypotesen: Ingen systematisk skillnad mellan patienter på A och på B Det är precis som i ”Spinn the bottle”: Vem som får en händelse väljs slumpmässigt.

Under nollhypotesen mi på A och ni på B vid snurr nummer i. xi indikator för att A-händelse Risken att någon på A drabbas nästa gång: mi / (mi + ni) Se på summan 𝑖 𝑥 𝑖 − 𝑚 𝑖 𝑚 𝑖 + 𝑛 𝑖 Notera: du kan stanna när du vill (censureringar)

Om testet är bra beror på mothypotesen (PH!) Antag att personer på A systematiskt viktas upp: 𝜃 𝑚 𝑖 𝜃 𝑚 𝑖 + 𝑛 𝑖 (Exempel med 𝜃=2) Ekvivalent med den vanliga formuleringen 𝜆 𝐴 𝑡 =𝜃 𝜆 𝐵 (𝑡)

Mothypotes: uppviktning av kontroller: ”Proportional hazards” Indikatorn för A-händelse har en tendens att överstiga prediktionen

Inte bara ett bra test utan bäst Betydligt bättre än Wilcoxons rangsummetest! (Förutom att lograngtestet klarar censureringar)

𝜃 𝑚 𝑖 𝜃 𝑚 𝑖 + 𝑛 𝑖 Coxregression Skatta θ, som har en lättbegriplig tolkning. Generalisera: 𝛽 och 𝑥 𝑖 kan lika gärna vara vektorer: 𝜃= 𝑒 𝛽 𝑇 𝑥 𝑖 𝜃 𝑚 𝑖 𝜃 𝑚 𝑖 + 𝑛 𝑖

Tillbaks till exemplen (coxph)!

Skattning av överlevnaden – givet Cox I Coxregressionen struntar man oftast i baseline-överlevnaden. Det är lite synd, eftersom man kan avända baseline-överlevnaden för att skatta allas överlevnad 𝑆 𝑡;𝑥 = 𝑆 0 𝑡 exp⁡( 𝛽 𝑇 𝑥) Man kan faktiskt använda sin anpassade Coxmodell för att skatta baselineöverlevnaden.

Att skatta baselineöverlevnad Vanlig Kaplan-Meier: 𝑆 𝑡 𝑛 = 1−𝑟 𝑡 1 × 1−𝑟 𝑡 2 ×…×(1−𝑟( 𝑡 𝑛 )) Om Cox är sann: Individ k motsvarar exp⁡(− 𝛽 𝑇 𝑥 𝑘 ) baselinepersoner. Skattning av baselinerisk då individ i dör: 𝑟 𝑡 𝑖 = exp⁡(− 𝛽 𝑇 𝑥 𝑖 ) 𝑘 𝑢𝑛𝑑𝑒𝑟 𝑟𝑖𝑠𝑘 exp⁡(− 𝛽 𝑇 𝑥 𝑘 )

I praktiken Skapa ett objekt av klass coxph (dvs. en Coxmodell) CP = coxph(Surv(time,cens) ~ variabler, ....) Utan Coxmodell anpassas överlevnadskurvor survfit(Surv(time,cens) ~ variabler,....) Har man en coxmodell, används survfit på den: survfit(CP,newdata = [de värden man vill ha],....) Nota bene: Förutsätter PH-antagandet.

Validering, nivå >1: jfr uppskattningen under Cox (”Breslow”)

Cox-Snell-residualer Varje individs överlevnadsfunktion kan uppskattas under Cox-modellen ( 𝑆 0 𝑡 exp 𝛽 𝑇 𝑥 𝑖 ) Vi vet att 𝐹 𝑋 ∼𝑈 0,1 ,vilket också gäller för 𝑆 𝑇 =1−𝐹(𝑇) ”Inversmetoden” ger − log 𝑆 𝑇 ~exp⁡(1) 𝐻 𝑇 =− log 𝑆 𝑋 ~exp⁡(1) Modellkontroll: Se om 𝐻 𝑡 𝑖 , 𝑥 𝑖 , 𝑖=1,…,𝑛 är censurerade observationer av exp⁡(1).

Två trans-forma-tioner

Cox-Snell-residualer Har en viss elegans Problem: Vart går vi om de visar avvikelse från PH? Är egentligen bättre lämpad för modeller utan censureringar Är inte residualer i vanlig mening

Pröva att låta datorn tänka åt dig! (Take a walk on the safe side!) Mothypotes: 𝛽 𝑡 =𝛽+𝜃𝑔(𝑡) för en valbar funktion. Lite av en black box: Nu vet vi att något inte stämmer med PH-antagandet i artscanI-studien, men inte riktigt vad. Registerstudien har klarat testet!

Experimentera i R!

?plot.cox.zph

Schönfeldresidualer Vilken är den bästa gissningen av (t.ex.) åldern på nästa som dör? Jo, ett viktat medelvärde! Jämför det verkliga värdet med gissningen. Normera!

Schönfeldresidualer Givet allt som hänt före 𝑡 𝑖 är kovariatvärdet vid 𝑡 𝑖 fördelat som 𝑃 𝑋 𝑘 = 𝑥 𝑖𝑘 = 𝑥 1𝑘 ;𝑠𝑙ℎ 𝑝 1 = 𝑒 𝛽 𝑇 𝑥 1𝑘 𝑖 𝑢𝑛𝑑𝑒𝑟 𝑟𝑖𝑠𝑘 𝑒 𝛽 𝑇 𝑥 𝑖𝑘 … 𝑥 𝑗𝑘 ;𝑠𝑙ℎ 𝑝 𝑗 = 𝑒 𝛽 𝑇 𝑥 𝑗𝑘 𝑖 𝑢𝑛𝑑𝑒𝑟 𝑟𝑖𝑠𝑘 𝑒 𝛽 𝑇 𝑥 𝑖𝑘 … …

Glöm matematiken. Summa summarum: Det går att finna förväntat värde (lämnas som övning) Jämförelsen mellan erhållet och förväntat värde ger Schoenfeldresidualerna. Emellertid kan man transformera Schoenfeldresidualerna så att de approximerar tidsberoende koefficienter: scaled Schoenfeld residuals. Fås bara för dem som haft en händelse.

Artscan I

”Recent study”

Varför inte pröva det här?

?residuals.coxph

Martingalresidualer 𝑟 𝑖 = 𝛿 𝑖 − 𝐻 ( 𝑡 𝑖 ; 𝑥 𝑖 ) 𝑆 𝑡 =exp⁡(− 𝐻 (𝑡)) Kumulativ hasard Det förväntade antalet dödar för pat. i om vederbörande vid varje död ersätts med en identisk (Minnesbild från Jan Lankes kurs i överlevnads-analys). Vid utträdestidpunkten har 𝛿 𝑖 (noll eller ett) dödar inträffat. Därför bör det förväntade värdet av 𝑟 𝑖 vara 0. 𝑟 𝑖 = 𝛿 𝑖 − 𝐻 ( 𝑡 𝑖 ; 𝑥 𝑖 ) 𝑆 𝑡 =exp⁡(− 𝐻 (𝑡))

Artscan I: Plotta resid. mot ålder survdata$mres = residuals(CP) plot(survdata$age, survdata$mres) scatter.smooth( survdata$age, survdata$mres ) En scatterplot smoother hjälper en att se tendensen

Ålder, kategoriserad eller kontinuerlig (Artscan I) Statistiker föredrar (ofta) kontinuerliga variabler, läkare kategoriska. Här finns ett sätt att kvalitativt beskriva skillnaden.

Behandlingeffekter ”recent study”

Sammanfattning Att plotta kumulativa hasarder i varje stratum fungerar bara i enkla fall Med Cox-Snell-residualer kan man undersöka PH-antagandet även i mer komplicerade fall – men det är oklart hur man går vidare. Om man misstänker tidsberoende koefficienter, kan man kontrollera detta med Schönfeldresidualer Martingalresidualer är de enda ”äkta residualerna”.