Predicting protein folding pathways.  Mohammed J. Zaki, Vinay Nadimpally, Deb Bardhan and Chris Bystroff  Artikel i Bioinformatics 2004.

Slides:



Advertisements
Liknande presentationer
F. Drewes, Inst. f. datavetenskap1 Föreläsning 13: Resolution •Resolution i satslogiken •Resolution i predikatlogiken.
Advertisements

Föreläsning 3 25 jan 2010.
Talföljder formler och summor
MaB: Andragradsfunktioner
Föreläsning 6 Slumptal Testa slumptal Slumptal för olika fördelningar
MaB: Ekvationssystem Allmänt
© Anders Broberg, Ulrika Hägglund, Lena Kallin Westin, 2003 Datastrukturer och algoritmer Föreläsning
Kurnik et al PNAS 2012 Frågeställning: Har laddade aminosyror en viktig roll i proteinveckningsprocessen för att t ex undvika oönskade interaktioner som.
hej och välkomna EKVATIONER Ta reda på det okända talet.
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Ruttplanering Vad är det??.
Numeriska beräkningar i Naturvetenskap och Teknik
Leif Håkansson’s Square Dancer Rotation
Institutionen för matematik, KTH Mats Boij 5B1118 Diskret matematik 5 november B1118 Diskret matematik Tredje föreläsningen - Kombinatorik.
För utveckling av verksamhet, produkter och livskvalitet. Rekursiva algoritmer, en annan sort tänkande -Hur -När -Bra/Dåligt (kap 7)
Föreläsning 15 Matlab överkurs KTH, CSC, Vahid Mosavat.
Föreläsning 7 Analys av algoritmer T(n) och ordo
För utveckling av verksamhet, produkter och livskvalitet. Algoritmer och datastructurer - Lite mer rekursivitet -Sorterrings algoritmer -- Kapitel 8 Algoritmer.
DoA VT -07 © Anders Broberg, Lena Kallin Westin, P = ((C,F,3), (B,D,3), (C,G,4),(A,F,4), (A,R,4), (C,D,5), (E,G,6), (B,R,6), (A,E,6), (A,C,8)) A.
Grundläggande programmering
Föreläsning 10 Länkade lista Stack och Kö Att arbeta med listor
Constructive Critique of Design Group 3 reviews Group 5.
FL2 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
Ämnen Följer kapitlen i boken
Algoritm analys och rekursiva metoder kap 5,7
Växjö 15 april -04Språk & logik: Reguljära uttryck1 DAB760: Språk och logik 15/4: Finita automater och 13-15reguljära uttryck Leif Grönqvist
© Anders Broberg, Ulrika Hägglund, Lena Kallin Westin, 2004 Datastrukturer och algoritmer Föreläsning 3.
Programmering B PHP Lektion 2
Detection of similarity between documents Axel Bengtsson Ola Olsson
Pathfinding. –Vad är det? –Sökning från A till B.
Programmering B PHP Lektion 3
Byggnadsmekanik gk 2.1 SNITTKRAFTER
Algoritmer och datastrukturer
TÄNK PÅ ETT HELTAL MELLAN 1-50
1 Joomla © 2009 Stefan Andersson 1. 2 MÅL 2 3 Begrepp Aktör: en användare som interagerar med webbplatsen. I diagrammet till höger finns två aktörer:
Listor En lista är en föränderlig ordnad samling objekt.
1.Välj en nod vilken som helst och markera den som öppen. Låt den bli rot. A R B F C D E G
Metoder för att mäta lätta kedjor i urin och serum
Grundläggande programmering
Rekursiva algoritmer Hur När Bra/Dåligt (kap 7).
SEO Manager för EPiServer LÅT REDAKTÖRERNA VARA REDAKTÖRER.
Det finns i V en operation kallad addition, betecknad + sådan att
KVALITATIV ANALYS - FACKVERK
Logikprogrammering 21/10 Binära träd
6558/G558 DATAKOMMUNIKATION Kapitel 3: Nätverk, ruttning.
Initiera nätverket med nollflöde. Kapaciteterna i svart ovan bågarna och flödet i grönt nedan bågarna. Skicka igenom ett enhetsflöde genom nätverket. Flödesvägen.
KNÄCKNING STELA BALKAR INSTABILITETSFENOMENET
Stopped-flow mätning GuHCl Log k Chevron Plot CmCm Folding regionUnfolding region.
Vara kommun Grundskoleundersökning 2014 Föräldrar 2 Levene skola årskurs 5 Antal svar 2014 för aktuell årskurs i skola: 12 Antal svar 2014 för årskurs.
Föreläsning 4 Listor, tupler, och for-loopar. Listor En lista är en föränderlig ordnad samling objekt. Listor skapas med hakparenteser. lista = [12,13,14,15]
© Anders Broberg, Ulrika Hägglund, Lena Kallin Westin, 2003 Föreläsning 12 Sökning och Sökträd.
Datorseende TexPoint fonts used in EMF: AA.
Kombinerade serie- och parallellnät
Graph och graph-algoritmer. Några enkla graph teorier Hur IP trafik hittar destinationen i Internät ? GPS-system ? Sociala nätverk. Vanligaste frågeställningar:
Bild 1 Prognos för länets arbetsmarknad Stefan Tjb.
Föreläsning 11 Logik med tillämpningar Innehåll u Generell resolution u Kapitel i Ben-Ari.
Föreläsning 9 Logik med tillämpningar Innehåll u Semantiska tablåer i predikatlogiken u Klausulform u Herbrandmodeller u Kapitel 3.5,
Datastrukturer och algoritmer VT08 P = ((C,F,3), (B,D,3), (C,G,4),(A,F,4), (A,R,4), (C,D,5), (E,G,6), (B,R,6), (A,E,6), (A,C,8)) A R B F C D E G
Logikprogrammering 23/10 Binära träd In- och uthantering David Hjelm.
© Anders Broberg, Ulrika Hägglund, Lena Kallin Westin, 2003 Datastrukturer och algoritmer Föreläsning 13 Sortering.
NÄTVERKSPROTOKOLL Föreläsning INNEHÅLL - Routingprotokoll - Interior gateway protocols - Exterior gateway protocols - Link state routing.
© Anders Broberg, Lena Kallin Westin, 2007 Datastrukturer och algoritmer Föreläsning 14.
För utveckling av verksamhet, produkter och livskvalitet. Algoritmer och Datastrukturer -- Kap 21,14 Prioritets Köer (Priority Queues ), Graph.
© Anders Broberg, Ulrika Hägglund, Lena Kallin Westin, 2003 Datastrukturer och algoritmer Föreläsning 16.
Växjö 14 april -04Språk & logik: Finita automater1 DAB760: Språk och logik 14/4:Finita automater Leif Grönqvist Växjö Universitet.
Algoritmer och loopar Algoritmer, beräkningsbarhet
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Operativsystem - Baklås Mats Björkman
Algoritmer och datastrukturer Föreläsning 8 Tidskomplexitet (Weiss kap
Presentationens avskrift:

Predicting protein folding pathways

 Mohammed J. Zaki, Vinay Nadimpally, Deb Bardhan and Chris Bystroff  Artikel i Bioinformatics 2004

Upplägg av presentationen  Motivering  Idén  Matematik  Algoritmer och exempel

Pathway prediction problem vs Protein folding problem  Givet aa-sekvens bestämma 3D- strukturen  Givet aa-sekvens och 3D-struktur bestämma ordnad sekvens av ”folding events”

Varför är folding pathways intressanta?  Lära sig mer om hur proteiner veckar sig, vanliga steg/sekvenser i veckningen  Sjukdomar som beror på felveckade proteiner: C-J, CF, hereditary emphysema

Idén  Ta 3D-strukturen för ett färdigveckat protein och veckla ut den steg för steg tills man har en linjär molekyl  Omvändningen av en sådan sekvens av veckningssteg utgör en trolig folding pathway

Ett antagande  Non-native contacts inte är viktiga  Native contacts bildas bara en gång under veckningen

Viktade SSE-grafer  En SSE(secondary structure element)-graf är en graf där alfahelixar och betaflak utgör noderna och där interaktioner mellan SSE utgör bågarna  Bågarna är viktade efter styrkan hos interaktionen mellan SSE:na

Viktade grafer  Noder, bågar och viktfunktionen

Cuts  Uppdelning av nodmängden V i två icke-tomma, disjunkta delmängder, C och C’, där C’ = V \ C  Kapaciteten hos ett cut är summan av vikterna på de bågar som har exakt en ändpunkt i C  Ett min-cut är den uppdelning i subgrafer som har minst kapacitet

Min-cuts  Min-cuts behöver inte vara unika  Det finns algoritmer som hittar min- cuts på O(|V||E|+|V| 2 log|V|)

Båge existerar om  Interaktionen mellan två SSE är större än ett tröskelvärde  SSE ligger bredvid varandra på peptide backbone

Beräkning av interaktion,   Kontaktbaserad  Avståndsbaserad  SAS (solvent accessible surface) - baserad

Kontaktbaserad interaktion  3D-koordinater  Euklidiskt avstånd mellan aa  Kontakt om

Kontaktbaserad interaktion  Contact map: binär NxN-matris med ettor om kontakt, annars nollor  Vikten bestäms av antalet kontakter mellan två SSE

Avståndsbaserad interaktion  Metoden är en utökning av kontaktbaserad interaktion där varje aa-par skalas efter hur nära varandra de är

Viktfunktionen W(e)  Kontaktbaserad  Avståndsbaserad  SAS (solvent accessible surface) - baserad

Metoden så här långt:  Ta 3D-struktur (tex. från PDB)  Skapa graf med SSE som noder  Beräkna styrka på interaktionen (tex. baserat på avstånd) mellan aa för att hitta bågarna  Tilldela varje båge en vikt

Exempel: IgG-binding protein G (2IGD)  61 aa  4 betaflak  1 alfahelix 11 44   C-term N-term

Algoritmen  Ett min-cut visar var interaktionen mellan SSE är svag  Det visar ett ställe där det är troligt att unfolding kan börja  Algoritmen Unfold hittar en trolig folding pathway

Algoritmen Unfold Unfold(G(V,E),W):C=NOI-MinCut(G,W) G C =(C,E C ); G C’ =(C’,E C’ ) if (|C|>1) Unfold(G C,W) if (|C’|>1) Unfold(G C’,W)

Exempel: IgG-binding protein G (2IGD) NOI-min-cut: {b2,b2,a1},{b4,b3} Kapacitet = 11+14=25 11 44   C-term N-term

Algoritmen Unfold Unfold(G(V,E),W):C=NOI-MinCut(G,W) G C =(C,E C ); G C’ =(C’,E C’ ) if (|C|>1) Unfold(G C,W) if (|C’|>1) Unfold(G C’,W)

Unfold tree     

Problem med Unfold  Väljer bara ett min-cuts  Det kan finnas flera med samma eller nästan samma kapacitet  Vill kunna hitta flera möjliga folding pathways

MultiUnfold  Om W(C) är kapaciteten för ett min- cut så definieras near min-cuts som (1+)W(C),   Detta ger flera möjliga vägar vid varje min-cut

Exempel: 2IDG (igen)  Här är kapaciteten av min-cut W(C)=25  Near min-cut blir, med =0.5, 1.5*25=37.5 11 44  

Near min-cuts på 2IGD  Förutom C={}, W(C)=25 fås då C’={}, W(C’)=27 och C’’={}, W(C’’)=36 11 44  

Near min-cuts  Detta ger många fler tänkbara folding pathways  Dessa kan även rankas efter hur troliga de är

Större exempel: Dihydrofolate Reductase

Sen då?  Man kan lägga till loop-regioner som noder i grafen  Testa algoritmerna på hela PDB för att se om man kan hitta liknande veckningsvägar för proteiner från samma familj

THE END! Frågor? Frågor?