Fall-kontroll-studier, mobiltelefoner och öron: försiktighet anbefalles Jan Lanke Seminarium 21 september 2011 1. Det medicinska problemet 2. Fall-kontroll-studier, vanlig version 3. Fall-kontroll-studier, speciell version
1. Det medicinska problemet Ökas sjukdomsrisker av strålning från mobiltelefoner? Många studier, inga klara svar. En studie undersökte risken för akustiskt neurom, en tämligen godartad tumör på hörselnerven. Med lämplig definition av ’exponerad’ finns det två sorters personer: exponerade oexponerade
Man fann att risken för tumör var klart högre hos exponerade personer än hos oexponerade (men då hade man rejäla krav på bereppet ’exponerad’). Så långt var det ’person’ som var analysenheten; men sen övergick man till att studera öron i stället för personer. För att kunna följa resonemanget måste vi införa studiens terminologi beträffande öron.
En oexponerad person har två oexponerade öron; en exponerad person har antingen två exponerade öron eller ett exponerat och ett oexponerat öra. Att en exponerad person kan ha ett oexponerat öra beror på att somliga personer systematiskt använder ett bestämt öra.
Mer precis terminologi: ett öra hos en oexponerad person kallas oexponerat ett exponerat öra (alltid hos en exponerad person) kallas i-exponerat. ett oexponerat öra hos en exponerad person kallas c-exponerat. (ipsilateralt; contralateralt)
Två resultat i den nämnda studien: tumörrisken är avsevärt högre för i-exponerade öron än för oexponerade; något lägre för c-exponerade öron än för oexponerade. Att hålla en mobiltelefon intill vänstra örat förefaller alltså skydda höger öra. Detta resultat förbryllade författarna åtskilligt, och de kunde inte ge någon övertygande förklaring. Jag ska försöka ge en förklaring, och den kommer att bli helt statistisk, alltså inte biologisk. Deras studie var en fall-kontroll-studie; låt mig repetera några elementära fakta om sådana.
2. Fall-kontroll-studier, vanlig version Från något lämpligt register, välj n.1 personer med D. Välj också n.0 personer utan D; vanligen n.0 = K n.1 där K≥1. Bestäm sedan exponeringsstatus för varje vald person. Såhär ser det alltså ut: Dc D Ec x00 x01 E x10 x11 n.0 n.1 n
Uppenbarligen kan vi skatta P[E│D], P[E│Dc] och alltså även Dc D Ec x00 x01 E x10 x11 n.0 n.1 n Uppenbarligen kan vi skatta P[E│D], P[E│Dc] och alltså även P[E│D]/P[E│Dc]. Men det är inte det som vi vill!
P[E│D]/P[E│Dc] ≠ P[D│E]/P[D│Ec]. Tyvärr: P[E│D]/P[E│Dc] ≠ P[D│E]/P[D│Ec]. det som vi kan skatta det som vi vill skatta Trick: se på odds i stället för sannolikheter oddskvoter i stället för relativa risker Vi kan förstås skatta O[E│D] och O[E│Dc] och alltså även kvoten O[E│D] / O[E│Dc]
O[E│D]/O[E│Dc] = O[D│E]/O[D│Ec]. Nu har vi tur: O[E│D]/O[E│Dc] = O[D│E]/O[D│Ec]. det som vi kan skatta det som vi vill skatta Det inser man så: vänstra ledet = P[E│D] P[Ec│D] P[Ec│Dc] P[E│Dc] = P[E D] P[Ec D] P[Ec Dc] P[E Dc] som är en symmetrisk funktion av E och D. Som förberedelse för nästa avsnitt inför jag lite tydligare beteckningar.
Vi har en population P där vissa är E (= exponerade); resten är Ec; vissa är D (= sjuka); resten är Dc; vissa är S (= utvalda att delta i studien). Givetvis är P[S│D] ≠ P[S│Dc] P[S│E] ≠ P[S│Ec] (såvida inte D och E är oberoende) men, och det är viktigt P[S│DE] = P[S│DEc] P[S│DcE] = P[S│DcEc].
0 = P[D│Ec], 1 = P[D│E] Vår population P ser ut såhär: där är de två sannolikheter som intresserar oss. Dc D Ec E0(1-0) E00 E0 E E1(1-1) E11 E1 D0 D1 8106 (e.g.)
0 = P[S│Dc], 1 = P[S│D]; Vi har också urvalssannolikheter normalt är 0 < < 1 . Nu ser vårt stickprov i medeltal ut så: Man ser att 0 och 1 försvinner ur stickprovets oddskvot, likaså E0 och E1 ; det är tur, eftersom de är okända. Dc D Ec E0(1-0)0 E001 E E1(1-1)0 E111 n0 n1
det som vi kan skatta det som vi vill skatta Vad är det som gör att man kan analysera en fall-kontroll-studie? Jag uppfattar det som att det är två saker det hänger på: urvalssannolikheterna 0 och 1 försvinner ur stickprovets oddskvot; 2. O[E│D]/O[E│Dc] = O[D│E]/O[D│Ec]. det som vi kan skatta det som vi vill skatta
3. Fall-kontroll-studier, speciell version Välj personer som beskrivits ovan, men analysera annorlunda. Vi har i populationen D0 + D1 personer, med 2(D0 + D1) öron där 2D0 + D1 är friska, D1 är sjuka. Vi förutsätter att ingen har två sjuka öron. Om vi ser på exponering så har vi 2E0 oexponerade öron 2E1 öron som är antingen i-exponerade eller c-exponerade. Men de personer, om det nu finns sådana, som har två i-exponerade öron bidrar inte till vår fråga (c-exponerade vs oexponerade), så dom bortser vi från.
Vi förutsätter alltså att vi har 2E0 oexponerade öron E1 i-exponerade öron E1 c-exponerade öron. Vi använde Dc och D för friska resp sjuka personer. För öron inför vi Gc = friska; det finns 2D0 +D1 sådana öron; G = sjuka; det finns D1 sådana öron.
Beträffande öronens exponering inför vi oE: oexponerade öron iE: i-exponerade öron cE: c-exponerade öron. Alltså: personer öron exponering Ec E oE iE cE sjukdom Dc D Gc G Sjukdomssannolikheterna heter o = P[G│oE], i = P[G│iE], c = P[G│cE].
Vår population av öron ser ut såhär: Nu behöver vi urvalssannolikheterna, en för var och en av de sex rutorna i vår 3x2-tabell. Vi kallar dem o0 o1 i0 i1 c0 c1 Gc G # oE 2E0(1-o) 2E0o 2E0 iE E1(1-i) E1i E1 cE E1(1-c) E1c 16106 (e.g.)
Alltså: första index exponering; andra index sjukdom. Gc G # oE 2E0(1-o) 2E0o 2E0 iE E1(1-i) E1i E1 cE E1(1-c) E1c o0 o1 i0 i1 c0 c1 Alltså: första index exponering; andra index sjukdom. De tre sannolikheterna i högra kolonnen är enkla: ett sjukt öra sitter alltid på en sjuk person, och har alltså urvalssannolikheten 1; o1 = i1 = c1 = 1
De tre återstående är mer komplicerade eftersom ett friskt öra (Gc) blir utvalt då och endast då dess ägare blir utvald, och sannolikheten för det beror på om ägaren är D eller Dc. Alltså: P(S│GcDc) = P(S│Dc) = 0 P(S│GcD) = P(S│D) = 1 (Något olika motivering för de två formlerna.) Det visar sig att vi också måste veta att P(D│oE Gc) = 0 P(D│iE Gc) = c P(D│cE Gc) = i
(Observera omkastningen av index i de två sista formlerna!) P(D│Ec Gc) = 0 P(D│iE Gc) = c P(D│cE Gc) = i (Observera omkastningen av index i de två sista formlerna!) Bevis för den sista formeln: Om ett öra är c-exponerat och friskt så är dess bärare sjuk då och endast då det motsatta örat är sjukt; men det örat är i-exponerat. De två andra bevisas analogt.
När vi beskriver urvalssannolikheten för ett friskt öra måste vi skilja mellan två fall beroende på om Gc-örat sitter på en Dc- person eller en D-person. Nu behöver vi den välkända formeln P(A) = P(B)P(A│B) + P(Bc)P(A│Bc), dock i varianten P(A│C) = P(B│C)P(A│BC) + P(Bc│C)P(A│BcC) Alltså i0 = P(S│iE Gc) = P(D│iE Gc)P(S│iE Gc D) + P(Dc│iE Gc)P(S│iE Gc Dc) = c1+ (1-c) 0
Alltså kan våra utvalda öron i medeltal beskrivas så: På samma sätt får vi o0 = 01+ (1-0) 0 c0 = i1+ (1-i) 0 Alltså kan våra utvalda öron i medeltal beskrivas så: I vänstra kolonnen har jag av typografiska skäl behållit -beteckningarna. Gc G oE 2E0(1-0) o0 2E001 iE E1(1-i) i0 E1i1 cE E1(1-c) c0 E1c1
2E0(1−0) o0 2E001 E1c1 E1(1−c) c0 dvs Om vi jämför cE-öron med oE-öron på vanligt sätt får vi en oddskvot som skattar 2E0(1−0) o0 2E001 E1c1 E1(1−c) c0 dvs c/(1−c) 0/(1−0) o0 c0 . Alltså har stickprovets oddskvot ett systematiskt fel. Gc G oE 2E0(1-0) o0 2E001 iE E1(1-i) i0 E1i1 cE E1(1-c) c0 E1c1
Stickprovets oddskvot störs av en faktor o0 /c0 ; kalla den c ( som i bias). På samma sätt kommer oddskvoten för jämförelse av iE-öron mot oE-öron att skatta i/(1−i) 0/(1−0) o0 i0 . och bias-faktorn i är o0 /i0 .
Vad kan man säga om dessa två bias-faktorer? En rimlig tanke är att i-exponering är skadlig att c-exponering inte är värre än i-exponering och inte bättre än ingen exponering: 0 < i, 0 ≤ c ≤ i Eftersom 0 < 1 blir då o0 < c0 , o0 ≤ i0 ≤ c0 och alltså c < 1, c ≤ i ≤ 1.
Om vi lite mer preciserat antar att i > c = 0 så ser man lätt att c < 1, i = 1. Alltså: oddskvoten för c-exponering relativt ingen exponering har en bias nedåt så snart i-exponering är skadlig; men motsvarande oddskvot för i-exponering saknar bias om c-exponering är ofarlig. Nu skulle man kunna stoppa in värden på 1 och 0 (egentligen 1/0) och i och 0 (= c) och se vad som händer. Men det ska vi inte göra.
Naturlig fråga: hur skulle man egentligen göra? Halvgenomtänkt idé: studera först enbart vänsteröron: välj n0 Dc-personer och betrakta deras vänsteröron; välj ”tillräckligt många” D-personer men släng dem som är G på höger öra, behåll n1 av dem som finns kvar; bestäm exponering hos alla utvalda öron; skriv upp i en 3x2-tabell; analysera den 2x2-tabell som man får genom att stryka mellersta raden. Efter att ha simulerat en del tror jag att det blir rätt. (Sen gör man förstås om det hela med högeröron.)