DNA-bevis För jämförelser mellan biologiska spår (blod, hår, saliv, hudrester, andra kroppsvätskor, mm.) och prov från en misstänkt förövare av ett brott.

Slides:



Advertisements
Liknande presentationer
F. Drewes, Inst. f. datavetenskap1 Föreläsning 13: Resolution •Resolution i satslogiken •Resolution i predikatlogiken.
Advertisements

Meningsbyggnad.
PowerPoint av Bendik S. Søvegjarto Koncept, text och regler av Skage Hansen.
Inferens om en population Sid
Talföljder formler och summor
Reactions an Equilibrium
Nyheter i NjuRen Februari o Mars 2014 E-hälsa och strategisk IT
En genomgång av spelet: Dubbelkrig-Grön
Att söka till högskolan
PowerPoint av Bendik S. Søvegjarto Koncept, text och regler av Skage Hansen.
Hej hypotestest!. Bakgrund  Signifikansanalys  Signifikansprövning  Signifikanstest  Hypotesprövning  Hypotestest Kärt barn har många namn Inblandade:
hej och välkomna EKVATIONER Ta reda på det okända talet.
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Klusterurval, forts..
Människan och arvet.
ERGONOMI Vad är det?.
Vill du lära dig kort division?
Nytt golv av finaste furu
FL3 732G81 Linköpings universitet.
FL8 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
FL10 732G81 Linköpings universitet.
FL9 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Inferens om en ändlig population Sid
Grundläggande programmering
732G22 Grunder i statistisk metodik
FL2 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
F11 Olika urvalsmetoder, speciellt obundet slumpmässigt urval (OSU)
Genetik IV
Elektroforetisk analys av isozymvariation Växt material Specifik infärgning Stärkelsegelelektrofores (SGE) – Polyakrylamidegelelektrofores.
Tillämpad statistik Naprapathögskolan
Felkalkyl Ofta mäter man inte direkt den storhet som är den intressanta, utan en grundläggande variabel som sedan används för att beräkna det som man är.
Skattningens medelfel
Genetik Intro.
IF1330 Ellära F/Ö1 F/Ö2 F/Ö3 Strömkretslära Mätinstrument Batterier
Det finns i V en operation kallad addition, betecknad + sådan att
Förelasning 6 Hypotesprövning
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
Fysikexperiment 5p Föreläsning Korrelationer Ett effektivt sätt att beskriva sambandet mellan två variabler (ett observationspar) är i.
Logikprogrammering 21/10 Binära träd
FL7 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
En guide för arbeten i SO
Binomialsannolikheter ritas i ett stolpdiagram
Simulering Introduktion Exempel: Antag att någon kastar tärning
Föreläsning 7 Fysikexperiment 5p Poissonfördelningen Poissonfördelningen är en sannolikhetsfördelning för diskreta variabler som är mycket.
Vara kommun Grundskoleundersökning 2014 Föräldrar 2 Levene skola årskurs 5 Antal svar 2014 för aktuell årskurs i skola: 12 Antal svar 2014 för årskurs.
Projekt 5.3 Gilpins och Ayalas θ-logistiska modell A Course in Mathematical Modeling - Mooney & Swift.
Mångfald inom en art Population och art. Vad är skillnaden?
Normalfördelningen och centrala gränsvärdessatsen
Leda och planera sokratiska samtal
Forskningsmetodik Sampling och urval Hypotesprövning Lektion 9
Föreläsning 11732G26 Surveymetosik med uppsats Urvalsvikter vid dragning med återläggning av PSU Vid urval utan återläggning: Använd analogin med Q i här:
Satslogik, forts. DAA701/716 Leif Grönqvist 5:e mars, 2003.
Fysikexperiment, 5p1 Random Walk 36 försök med Random walk med 1000 steg. Beräknad genomsnittlig räckvidd är  1000  32. Visualisering av utfallsrum.
Några allmänna räkneregler för sannolikheter
732G22 Grunder i statistisk metodik
1 Fler uträkningar med normalfördelningstabell Låt X vara Nf(170,5). Beräkna Lösning:
IE1206 Inbyggd Elektronik F1 F2
  2 f ( 2 ) Chi-Square Distribution: df=10, df=30, df=50 df = 10 df = 30 df = 50 Chi-2-fördelningen.
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
Betingade sannolikheter. 2 Antag att vi kastar en tärning och noterar antalet prickar som kommer upp. Låt A vara händelsen ”udda antal prickar”, dvs.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
Sannolikhet och statistik Tabell Används för att ge en bra överblick av svaren man fått in, datan. Består av rader och kolumner. Frekvens Är hur många.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.
Samband & Inferens Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband mellan kvot-varibaler –Korrelationskoefficient.
Marknadsundersökning Kap 12
Y 5.4 Tabeller och diagram Frekvens och relativ frekvens
Presentationens avskrift:

DNA-bevis För jämförelser mellan biologiska spår (blod, hår, saliv, hudrester, andra kroppsvätskor, mm.) och prov från en misstänkt förövare av ett brott. För fastställande av faderskap För identifikation av döda kroppar Mm.

DNA-analys bygger på studium av allelförekomst i ett antal markörer eller loci (ett locus) i DNA-kedjan Markörerna väljs bland de delar av DNA-kedjan som är (enligt nuvarande kunskap) funktionslösa (80-90% av all DNA) F.n. undersöks s.k. STR (Short Tandem Repeats). En allel i en markör definieras som antalet repetitioner av en viss följd av kvävebaser. Biologiskt skolade personer kan betydligt mer om detta. Icke-biologiskt skolade rekommenderas därför att söka på STR DNA för mer information om hur STR används.

Värdering av DNA-resultat görs på makro-nivå, dvs Värdering av DNA-resultat görs på makro-nivå, dvs. Det är inte nödvändigt att förstå hur DNA-kedjan är uppbyggd för att kunna göra värderingen. Utgångspunkter i det följande är därför: Ett antal markörer undersöks (10 används t.ex. vid SKL) I varje markör finns två alleler, en kommer från modern och en från fadern De två allelerna utgör markörens genotyp Genotyperna för flera markörer kan redovisas som en DNA-profil Om de två allelerna i en genotyp är likadana säges individen vara homozygot i denna markör, annars heterozygot. Genotypen anges som regel med de allelbeteckningar som används, t.ex. (8, 11), (8, 8), (A, A), (A, B)

I en population av individer förekommer olika genotyper i varje markör i olika frekvenser . Om vi känner till frekvensen för en viss genotyp, t.ex. (8, 11), i populationen kan denna användas för att beräkna resultatvärdet. Antag t.ex. att ett blodspår visar på denna genotyp i markören och att en misstänkt har samma genotyp i markören. Kalla detta resultat E. Låt HP = “Blodspåret kommer från den misstänkte” och HD = “Blodspåret kommer från någon annan än den misstänkte” P(E | HP ) = 1 och P( E | HD ) = relativa frekvensen av (8, 11) i denna markör i populationen. Antag att denna relativa frekvens är 5% 

LR = 20 är ju inget särskilt imponerande resultat. För att nå de berömda nivåerna krävs att vi kombinerar resultaten från flera markörer. Länkningsjämvikt i en population: Genotyper i olika (icke-funktionella) markörer (på olika kromosomer) förekommer oberoende av varandra i en slumpmässigt vald individ. Antag nu att vi har undersökt tre markörer och observerat genotyperna (8,11), (20, 9) resp. (13,13) i spåret och likadant hos den misstänkte. Dessa tre resultat (dvs. överensstämmelserna i respektive markör) kallar vi E1 , E2 och E3 . Antag att frekvenserna för de tre genotyperna i respektive markör i populationen är 5%, 10% resp. 3% Enligt länkningsjämvikten är E1 , E2 och E3 oberoende resultat.

 och (som tidigare) Genast mycket bättre!

Problem: För att kunna använda genotypfrekvenser på detta sätt krävs att vi typar ett mycket stort antal individer i populationen. T.ex. För att den relativa frekvensen 5% skall vara stabil krävs att vi med hög säkerhet kan påstå att frekvensen finns i intervallet (4.5%, 5.5%), dvs en felmarginal i ett konfidensintervall får högst vara 0.5%. En 99%-ig felmarginal är (som bekant) där p är den sanna aktuella relativa frekvensen i populationen och n är antalet typade personer. Om nu p verkligen är 5% krävs alltså att

För p = 10% och 99.9% säkerhet krävs 38967 typade personer. För att komma ifrån detta problem används några andra jämvikts- och justeringsregler. Hardy-Weinberg-jämvikt I en population där fortplantning kan anses ske helt slumpmässigt gäller att alleller i en markör hos en slumpmässigt vald individ förekommer oberoende av varandra.

Homozygota fallet: Beteckna genotypen (A, A ) och låt pA = Relativa frekvensen för allel A i populationen.  enligt teorin för binomialfördelade variabler (!!) Heterozygota fallet: Beteckna genotypen (A, B ) och låt pA och pB vara de relativa frekvenserna för allel A resp. B i populationen. enligt teorin för multinomiala variabler. Obs! Varken binomial- eller multinomialfördelningen behövs i dessa enkla exempel! Ovanstående går att inse ändå.

Låt pAA beteckna relativa frekvensen för en homozygot markör (med allel A ) och pAB beteckna relativa frekvensen för en heterozygot markör (med allelerna Aoch B ). Ovanstående relationer kan då skrivas dvs. relationerna anger hur vi går från allelfrekvens till genotypfrekvens. Hur blir det då med det omvända? Varje allel kan förekomma endera tillsammans med en likadan allel eller med en annan allel  Observera att denna formel är en förenkling där vi inte dubbelräknar alleler och gör motsvarande halvering av populationen.

Om vi nu inte kan räkna med att förökning sker slumpmässigt? Justering av relationerna bör göras utifrån kunskap om inavel och andra populationsskevheter. Balding & Nichols har härlett följande analogi till Hardy-Weinberg-jämviktens relationer där F är en justeringsfaktor för skevheter i populationen (engelska co-ancestry coefficient) Värdet hos F kan utredas med mer ingående genetiska studier, men sådana har visat att en godtagbar övre gräns är 0.03. Med F = 0 erhålls H-W jämvikt

Genotypfrekvenser kan nu uppskattas med hjälp av allelfrekvenser via dessa relationer. Med detta förfarande krävs betydligt färre typade individer för att hög säkerhet skall uppnås i de beräknade genotypfrekvenserna. För måttligt stora populationer kan det räcka med runt 300 typade individer Själva förfarandet att värdera resultat påverkas förstås inte av detta

Faderskapsbestämning Låt Gc beteckna genotypen i en viss markör hos ett barn, vars far skall fastställas. Låt Gm och Gp beteckna motsvarande genotyper hos modern och den verklige fadern (p står för paternal genotype). Låt vidare Gpp beteckna motsvarande genotyp hos en utpekad fader (putative paternal genotype) Notera att vi utgår från att Gc , Gm och Gpp är kända, men förstås inte Gp . Hypoteser: HP : Gpp = Gp HD : Gpp  Gp (Observera att det i detta sammanhang egentligen är någon åklagare eller något försvar som ligger bakom hypoteserna. Vi behöver inte ens se det som fällande resp. friande hypoteser.)

Resultatet i detta sammanhang utgörs av Gc Resultatet i detta sammanhang utgörs av Gc . Vi kan ju inte hitta någon överensstämmelse i genotyp etersom en av allelerna kommer från modern. Likelihood-kvoten för resultatet i denna markör blir då Låt Am beteckna allelen från modern och Ap allelen från fadern. Utveckling av täljaren:

Homozygota fallet, Gc = ( i , i ) : Täljaren blir här dvs. Ap beror ej av Am Täljaren kan alltså anta något av värdena 1, 0.5 eller 0.25

Heterozygota fallet, Gc = ( i , j ) : Täljaren blir här generellt eftersom bägge allelerna inte kan vara lika. En av dessa termer kan bli = 0 beroende på om modern eller den påstådde fadern är heterozygota med en annan allel än i och j.

Utveckling av nämnaren: Homozygota fallet, Gc = ( i , i ): där pi är relativa frekvensen för allel i i populationen och P(Am = i | Gm ) bestäms som tidigare

Heterozygota fallet, Gc = ( i , j ) : I varje markör kan nu likelihoodkvoten bestämmas med hjälp av ovanstående räkneregler. Länkningsjämvikten ger nu att dessa likelihoodkvoter kan länkas samman till ett slutligt resultatvärde, kallat faderskapsindex (paternity index): men notera att en explicit formel för detta är meningslös.