DNA-bevis För jämförelser mellan biologiska spår (blod, hår, saliv, hudrester, andra kroppsvätskor, mm.) och prov från en misstänkt förövare av ett brott. För fastställande av faderskap För identifikation av döda kroppar Mm.
DNA-analys bygger på studium av allelförekomst i ett antal markörer eller loci (ett locus) i DNA-kedjan Markörerna väljs bland de delar av DNA-kedjan som är (enligt nuvarande kunskap) funktionslösa (80-90% av all DNA) F.n. undersöks s.k. STR (Short Tandem Repeats). En allel i en markör definieras som antalet repetitioner av en viss följd av kvävebaser. Biologiskt skolade personer kan betydligt mer om detta. Icke-biologiskt skolade rekommenderas därför att söka på STR DNA för mer information om hur STR används.
Värdering av DNA-resultat görs på makro-nivå, dvs Värdering av DNA-resultat görs på makro-nivå, dvs. Det är inte nödvändigt att förstå hur DNA-kedjan är uppbyggd för att kunna göra värderingen. Utgångspunkter i det följande är därför: Ett antal markörer undersöks (10 används t.ex. vid SKL) I varje markör finns två alleler, en kommer från modern och en från fadern De två allelerna utgör markörens genotyp Genotyperna för flera markörer kan redovisas som en DNA-profil Om de två allelerna i en genotyp är likadana säges individen vara homozygot i denna markör, annars heterozygot. Genotypen anges som regel med de allelbeteckningar som används, t.ex. (8, 11), (8, 8), (A, A), (A, B)
I en population av individer förekommer olika genotyper i varje markör i olika frekvenser . Om vi känner till frekvensen för en viss genotyp, t.ex. (8, 11), i populationen kan denna användas för att beräkna resultatvärdet. Antag t.ex. att ett blodspår visar på denna genotyp i markören och att en misstänkt har samma genotyp i markören. Kalla detta resultat E. Låt HP = “Blodspåret kommer från den misstänkte” och HD = “Blodspåret kommer från någon annan än den misstänkte” P(E | HP ) = 1 och P( E | HD ) = relativa frekvensen av (8, 11) i denna markör i populationen. Antag att denna relativa frekvens är 5%
LR = 20 är ju inget särskilt imponerande resultat. För att nå de berömda nivåerna krävs att vi kombinerar resultaten från flera markörer. Länkningsjämvikt i en population: Genotyper i olika (icke-funktionella) markörer (på olika kromosomer) förekommer oberoende av varandra i en slumpmässigt vald individ. Antag nu att vi har undersökt tre markörer och observerat genotyperna (8,11), (20, 9) resp. (13,13) i spåret och likadant hos den misstänkte. Dessa tre resultat (dvs. överensstämmelserna i respektive markör) kallar vi E1 , E2 och E3 . Antag att frekvenserna för de tre genotyperna i respektive markör i populationen är 5%, 10% resp. 3% Enligt länkningsjämvikten är E1 , E2 och E3 oberoende resultat.
och (som tidigare) Genast mycket bättre!
Problem: För att kunna använda genotypfrekvenser på detta sätt krävs att vi typar ett mycket stort antal individer i populationen. T.ex. För att den relativa frekvensen 5% skall vara stabil krävs att vi med hög säkerhet kan påstå att frekvensen finns i intervallet (4.5%, 5.5%), dvs en felmarginal i ett konfidensintervall får högst vara 0.5%. En 99%-ig felmarginal är (som bekant) där p är den sanna aktuella relativa frekvensen i populationen och n är antalet typade personer. Om nu p verkligen är 5% krävs alltså att
För p = 10% och 99.9% säkerhet krävs 38967 typade personer. För att komma ifrån detta problem används några andra jämvikts- och justeringsregler. Hardy-Weinberg-jämvikt I en population där fortplantning kan anses ske helt slumpmässigt gäller att alleller i en markör hos en slumpmässigt vald individ förekommer oberoende av varandra.
Homozygota fallet: Beteckna genotypen (A, A ) och låt pA = Relativa frekvensen för allel A i populationen. enligt teorin för binomialfördelade variabler (!!) Heterozygota fallet: Beteckna genotypen (A, B ) och låt pA och pB vara de relativa frekvenserna för allel A resp. B i populationen. enligt teorin för multinomiala variabler. Obs! Varken binomial- eller multinomialfördelningen behövs i dessa enkla exempel! Ovanstående går att inse ändå.
Låt pAA beteckna relativa frekvensen för en homozygot markör (med allel A ) och pAB beteckna relativa frekvensen för en heterozygot markör (med allelerna Aoch B ). Ovanstående relationer kan då skrivas dvs. relationerna anger hur vi går från allelfrekvens till genotypfrekvens. Hur blir det då med det omvända? Varje allel kan förekomma endera tillsammans med en likadan allel eller med en annan allel Observera att denna formel är en förenkling där vi inte dubbelräknar alleler och gör motsvarande halvering av populationen.
Om vi nu inte kan räkna med att förökning sker slumpmässigt? Justering av relationerna bör göras utifrån kunskap om inavel och andra populationsskevheter. Balding & Nichols har härlett följande analogi till Hardy-Weinberg-jämviktens relationer där F är en justeringsfaktor för skevheter i populationen (engelska co-ancestry coefficient) Värdet hos F kan utredas med mer ingående genetiska studier, men sådana har visat att en godtagbar övre gräns är 0.03. Med F = 0 erhålls H-W jämvikt
Genotypfrekvenser kan nu uppskattas med hjälp av allelfrekvenser via dessa relationer. Med detta förfarande krävs betydligt färre typade individer för att hög säkerhet skall uppnås i de beräknade genotypfrekvenserna. För måttligt stora populationer kan det räcka med runt 300 typade individer Själva förfarandet att värdera resultat påverkas förstås inte av detta
Faderskapsbestämning Låt Gc beteckna genotypen i en viss markör hos ett barn, vars far skall fastställas. Låt Gm och Gp beteckna motsvarande genotyper hos modern och den verklige fadern (p står för paternal genotype). Låt vidare Gpp beteckna motsvarande genotyp hos en utpekad fader (putative paternal genotype) Notera att vi utgår från att Gc , Gm och Gpp är kända, men förstås inte Gp . Hypoteser: HP : Gpp = Gp HD : Gpp Gp (Observera att det i detta sammanhang egentligen är någon åklagare eller något försvar som ligger bakom hypoteserna. Vi behöver inte ens se det som fällande resp. friande hypoteser.)
Resultatet i detta sammanhang utgörs av Gc Resultatet i detta sammanhang utgörs av Gc . Vi kan ju inte hitta någon överensstämmelse i genotyp etersom en av allelerna kommer från modern. Likelihood-kvoten för resultatet i denna markör blir då Låt Am beteckna allelen från modern och Ap allelen från fadern. Utveckling av täljaren:
Homozygota fallet, Gc = ( i , i ) : Täljaren blir här dvs. Ap beror ej av Am Täljaren kan alltså anta något av värdena 1, 0.5 eller 0.25
Heterozygota fallet, Gc = ( i , j ) : Täljaren blir här generellt eftersom bägge allelerna inte kan vara lika. En av dessa termer kan bli = 0 beroende på om modern eller den påstådde fadern är heterozygota med en annan allel än i och j.
Utveckling av nämnaren: Homozygota fallet, Gc = ( i , i ): där pi är relativa frekvensen för allel i i populationen och P(Am = i | Gm ) bestäms som tidigare
Heterozygota fallet, Gc = ( i , j ) : I varje markör kan nu likelihoodkvoten bestämmas med hjälp av ovanstående räkneregler. Länkningsjämvikten ger nu att dessa likelihoodkvoter kan länkas samman till ett slutligt resultatvärde, kallat faderskapsindex (paternity index): men notera att en explicit formel för detta är meningslös.