TDDD74 Databaser för bioinformatik

Slides:



Advertisements
Liknande presentationer
Butiksdata.
Advertisements

Svenska WebDewey Introduktion
Vad är en databas? “En databas är en delad samling logiskt relaterade data som designats för att möta informationsbehovet i en organisation eller för.
Innehåll, huvudpresentation 4. Rangordning av ordningsstörningar (fråga 1) 5. Problem med nedskräpning (fråga 1a) 6. Problem med skadegörelse (fråga 1b)
Beräkning av kommunernas och samkommunernas utgifter år 2012
1 Medarbetarenkät 2011 • 573 svar. 2 Kön 3 Jag är knuten till en klass, undervisningsgrupp eller barngrupp.
Konstföreningen Dragning På sista sidan finns konstnärerna för respektive tavla.
BENÄMNA lätta ord SPRÅKTRÄNING VID AFASIKg VIII
Tillämpning av bolagsstyrningskoden vid årsstämmor 2005 och 2006.
Vad tycker NyföretagarCentrums kunder om rådgivningen? Hur många har startat företag efter rådgivningen? Branscher, omsättning, anställda? Jämförelse
Hela Sverige ska leva Totalrapport. Regeringens bidrag har medverkat till kunskapsförmedling?
Leif Håkansson’s Square Dancer Rotation
Projektföljeforskning
Datamodellering med E/R-diagram
Eddie Arnold - Make The World Go Away Images colorées de par le monde Déroulement automatique ou manuel à votre choix 1 för dig.
Elkraft 7.5 hp distans: Kap. 3 Likströmsmotorn 3:1
Förstudie 2. Design 3. Migrering 4 Analys av befintlig miljö –Microsoft Assessment and Planning (MAP) kan användas för att analysera sin miljö.
LANDSTINGSDIREKTÖRENS STAB Regional utveckling BILD 1 Resultat av enkät till landstingspolitiker
Svenska WebDewey Introduktion
Sidnummer1 Svensk utgivning 2011 enligt Dewey Hur blev det? Harriet Aagaard Olof Osterman.
Skånedatabasen & Region Skånes tillgänglighetsmodell
Karolinska Institutet, studentundersökning Studentundersökning på Karolinska Institutet HT 2013.
NyföretagarCentrums resultat 2013 NYFÖRETAGARCENTRUM – RESULTAT 2013.
Kommunpussel Din uppgift är att sortera de organisatoriska delar på nästa sida på ett sådant sätt att det överensstämmer med hur din kommun är organiserad.
Punktprevalensmätning av trycksår 2011, v.40 Resultat från landstingen
V E R S I O N N R 2. 0 T A V E L I D É E R I M I L J Ö.
Bastugatan 2. Box S Stockholm. Blad 1 Läsarundersökning Maskinentreprenören 2007.
Svenska WebDewey Introduktion Harriet Aagaard Svenska Deweyredaktion
Enkätresultat för Grundskolan Elever 2014 Skola:Hällby skola.
Avståndets betydelse för luft- föroreningshalter vid vägar och tunnelmynningar - Jämförelser mellan mätta och beräknade halter av kväveoxider (NO x )
Avgiftsstudie Nils Holgersson år 2007 Bild 1 Baserat på rapportversion
KASAM-13, medelvärden, årskurs 9, 1999
Finländarnas uppfattningar om äldrevården Kirsi Markkanen Utvecklingschef Tehy rf.
1 Vänsterskolan Debattartiklar. 2 Aktuell krok 3 Aktuella krokar 1. Direkt krok.
Postmilen båda banorna
(2) Avvikelse från std. kostnad (5) Andel inv 65+ med insats (4) Andel 80+ i befolkningen (1) Kronor/ invånare (65+) (3) Kronor/ brukare (6) Ytterfall.
Hittarps IK Kartläggningspresentation år 3.
Från Gotland på kvällen (tågtider enligt 2007) 18:28 19:03 19:41 19:32 20:32 20:53 21:19 18:30 20:32 19:06 19:54 19:58 20:22 19:01 21:40 20:44 23:37 20:11.
Arbetspensionssystemet i bilder Bildserie med centrala uppgifter om arbetspensionssystemet och dess funktion
DATABASHANTERING för programmerare Lektion 3 Mahmud Al Hakim
TÄNK PÅ ETT HELTAL MELLAN 1-50
/hp Beräkning av kommunernas och samkommunernas utgifter år 2013 Övriga utgifter 0,81 md € Investeringar 4,70 md € Övr. verksamhetskostn. 0,79.
Helhet Händelse Agerande Kunskap om vardagsverksamheten Förståelse av vardagsverksamheten.
1 Joomla © 2009 Stefan Andersson 1. 2 MÅL 2 3 Begrepp Aktör: en användare som interagerar med webbplatsen. I diagrammet till höger finns två aktörer:
Kouzlo starých časů… Letadla Pár foteček pro vzpomínku na dávné doby, tak hezké snění… M.K. 1 I Norrköping får man inte.
Best pictures on the internet 2007 Awards 1http:// Är vänsteralliansen trovärdig i Norrköping.
Enkätresultat för Fritidshem Elever 2014 Skola:Fritidselever, Gillberga skola.
Best pictures on the internet 2007 Awards 1http:// (s), (v), och (mp) i Norrköping, gillar inte att vi använder grundlagarna.
2 Agenda 1. Börja arbeta med Excel Hantera arbetsböcker 3. Formler 4. Formatera 5. Diagram 6. Skriva ut 7. Referenser mellan kalkylblad 8. Arbeta.
Arbetspensionssystemet i bilder Bildserie med centrala uppgifter om arbetspensionssystemet och dess funktion
1 Munkedal 2009 Sveriges Kommuner och Landsting Signild Östgren Leif Klingensjö.
Andel av befolkningen 80+ med olämpliga läkemedel Nacka Länet Riket 31,5 28,2 31,6 31,0 27,8 30,4 28,1 26,4 27,0 24,9 24,0 23,5.
SDDB hösten 2003 Preliminära resultat Svensk Njurmedicinsk Förening Riksstämman Stockholm KG Prütz Verksamhetsområde Internmedicin Helsingborgs.
Mahmud Al Hakim 2  Mål för kursen  Kursplanering  Kurslitteratur  Betygsättning  Grunder om databaser  Tabeller.
Enkätresultat för Grundskolan Föräldrar 2014 Skola - Gillberga skola.
Regional handlingsplan ”Det goda livet för sjuka äldre” RESULTAT i VG+Skaraborg.
OpCon/xps - A case study. Club2200Page 1 OpCon/xps – A case study Club2200 Magnus Nyman & Hans Forslind.
Smittspårarutbildning
Kartminne En serie bilder som ger övning av ”rutinen” Tänk på: –Vart är jag på väg? –Varifrån är kontrollen lättast att ta? –Vilken är sista säkra? –Förenkla.
Sidnummer Kataloger och sökverktyg hur kan vi använda DDK?
Räkna till en miljard 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13,14,15,16,17,18,19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, En miljard är ett.
© Anders Broberg, Ulrika Hägglund, Lena Kallin Westin, 2003 Föreläsning 12 Sökning och Sökträd.
Förskoleenkät Föräldrar 2012 Förskoleenkät – Föräldrar Enhet:Hattmakarns förskola.
DATABASHANTERING för programmerare Lektion 5 Mahmud Al Hakim
Bild 1 Prognos för länets arbetsmarknad Stefan Tjb.
Grundskola Elever 2013 Grundskoleenkät - Elever Enhet: Gillberga skola.
1 Jan Lundström OV’s Hemsida Utbildning Ledare. 2 Jan Lundström OV’s Hemsida Standard Lagrum.
TDDD74 Databaser för bioinformatik
Hur lagras informationen. (hög nivå) Hur accessar man informationen
Presentationens avskrift:

TDDD74 Databaser för bioinformatik http://www.ida.liu.se/~TDDD74 2001-10-01 GET THAT PROTEIN! Eller TDDD74 Databaser för bioinformatik http://www.ida.liu.se/~TDDD74

Lärare Examinator: Jose M Pena FÖ: Jose, Patrick Lambrix 2001-10-01 Lärare Examinator: Jose M Pena FÖ: Jose, Patrick Lambrix LA: Dag Sonntag projekt: Patrick databasadministration: Dag kursadministration: Dag studierektor: Patrick

2001-10-01 Kurslitteratur Elmasri, Navathe, Fundamentals of Database Systems, (4e eller 5e upplaga) ELLER Databases systems – models, languages, design and application programming (6e upplaga), Addison Wesley, 2004/2006/2010. Artiklar (på hemsidan + delas ut) Labkompendium: Databases, ADIT (på hemsidan)

Databaser Ett (av flera) sätt att lagra data i elektronisk format 2001-10-01 Databaser Ett (av flera) sätt att lagra data i elektronisk format Används i det vardagliga livet: bank, bokning av hotell eller resa, sökning i biblioteket, handla nyare tillämpningar: multimediadatabaser, geografiska informationssystem, realtiddatabaser

2001-10-01 Databaser databashanteringssystem (DBMS): en uppsättning program som tillåter en användare att skapa och underhålla en databas databassystem = databas + databashanteringssystem

2001-10-01 Bioinformatik Kända sekvenser samlas i en stor databas. Insamlande och studier av sekvenser och jämförelser av sekvensernas uppbyggnad i olika organismer kallas bioinformatik. Forskningen inom bioinformatik är beroende av avancerad datalogi och matematik. (forksningsrådens strategidokument 2000)

2001-10-01 Bioinformatik Bioinformatics: research, development, or application of computational tools and approaches for expanding the use of biological, medical, behavioral or health data, including those to acquire, store, organize, archive, analyze or visualize data. (National Institutes of Health)

Bioinformatik Ämnen på ISMB: protein structure and modeling 2001-10-01 Bioinformatik Ämnen på ISMB: protein structure and modeling sequence motifs, alignments and families networks and modeling gene structure, regulation and modeling sequence and phylogeny databases, information and knowledge management

TDDD74 Databaser för Bioinformatik 2001-10-01 TDDD74 Databaser för Bioinformatik Denna kurs: fokus på biologiska databanker

Relation med andra kurser inom TB-programmet: 2001-10-01 Relation med andra kurser inom TB-programmet: - förkunskaper: molekylärbiologi, programmering - bioinformatik - översikt och tillämpningar - projekt bioinformatik

Årets ändringar i kursen 2001-10-01 Årets ändringar i kursen

Biologiska databanker 2001-10-01 Biologiska databanker biologisk data i elektronisk format exempel: SWISS-PROT, EMBL, DDBJ, PDB, GENBANK, KEGG, ACEDB används dagligen i forskningen

Biologiska databanker 2001-10-01 Biologiska databanker Forsknings- resultat Modell Frågor Svar Databank- system Fysiska databanken hanterings- behandling av frågor/uppdateringar Access till lagrad data

Frågeställningar Vilken information lagrar man? 2001-10-01 Frågeställningar Vilken information lagrar man? Hur lagras informationen? (hög och låg nivå) Hur accessar man informationen? (användarnivå, systemnivå) Hur återställer man en databank efter crash? Hur kan flera användare accessa och uppdatera informationen samtidigt? Hur kan man accessa informationen i flera databanker samtidigt?

Personer databankadministratör databankdesigner användare (’end user’) 2001-10-01 Personer databankadministratör databankdesigner användare (’end user’) programmerare av tillämpningar DBMS designer utvecklare av verktyg operator, underhåll

1 tgctacccgc gcccgggctt ctggggtgtt ccccaaccac ggcccagccc tgccacaccc 2001-10-01 1 tgctacccgc gcccgggctt ctggggtgtt ccccaaccac ggcccagccc tgccacaccc 61 cccgcccccg gcctccgcag ctcggcatgg gcgcgggggt gctcgtcctg ggcgcctccg 121 agcccggtaa cctgtcgtcg gccgcaccgc tccccgacgg cgcggccacc gcggcgcggc 181 tgctggtgcc cgcgtcgccg cccgcctcgt tgctgcctcc cgccagcgaa agccccgagc 241 cgctgtctca gcagtggaca gcgggcatgg gtctgctgat ggcgctcatc gtgctgctca 301 tcgtggcggg caatgtgctg gtgatcgtgg ccatcgccaa gacgccgcgg ctgcagacgc 361 tcaccaacct cttcatcatg tccctggcca gcgccgacct ggtcatgggg ctgctggtgg 421 tgccgttcgg ggccaccatc gtggtgtggg gccgctggga gtacggctcc ttcttctgcg 481 agctgtggac ctcagtggac gtgctgtgcg tgacggccag catcgagacc ctgtgtgtca 541 ttgccctgga ccgctacctc gccatcacct cgcccttccg ctaccagagc ctgctgacgc 601 gcgcgcgggc gcggggcctc gtgtgcaccg tgtgggccat ctcggccctg gtgtccttcc 661 tgcccatcct catgcactgg tggcgggcgg agagcgacga ggcgcgccgc tgctacaacg 721 accccaagtg ctgcgacttc gtcaccaacc gggcctacgc catcgcctcg tccgtagtct 781 ccttctacgt gcccctgtgc atcatggcct tcgtgtacct gcgggtgttc cgcgaggccc 841 agaagcaggt gaagaagatc gacagctgcg agcgccgttt cctcggcggc ccagcgcggc 901 cgccctcgcc ctcgccctcg cccgtccccg cgcccgcgcc gccgcccgga cccccgcgcc 961 ccgccgccgc cgccgccacc gccccgctgg ccaacgggcg tgcgggtaag cggcggccct 1021 cgcgcctcgt ggccctacgc gagcagaagg cgctcaagac gctgggcatc atcatgggcg 1081 tcttcacgct ctgctggctg cccttcttcc tggccaacgt ggtgaaggcc ttccaccgcg 1141 agctggtgcc cgaccgcctc ttcgtcttct tcaactggct gggctacgcc aactcggcct 1201 tcaaccccat catctactgc cgcagccccg acttccgcaa ggccttccag ggactgctct 1261 gctgcgcgcg cagggctgcc cgccggcgcc acgcgaccca cggagaccgg ccgcgcgcct 1321 cgggctgtct ggcccggccc ggacccccgc catcgcccgg ggccgcctcg gacgacgacg 1381 acgacgatgt cgtcggggcc acgccgcccg cgcgcctgct ggagccctgg gccggctgca 1441 acggcggggc ggcggcggac agcgactcga gcctggacga gccgtgccgc cccggcttcg 1501 cctcggaatc caaggtgtag ggcccggcgc ggggcgcgga ctccgggcac ggcttcccag 1561 gggaacgagg agatctgtgt ttacttaaga ccgatagcag gtgaactcga agcccacaat 1621 cctcgtctga atcatccgag gcaaagagaa aagccacgga ccgttgcaca aaaaggaaag 1681 tttgggaagg gatgggagag tggcttgctg atgttccttg ttg

DEFINITION Homo sapiens adrenergic, beta-1-, receptor 2001-10-01 DEFINITION Homo sapiens adrenergic, beta-1-, receptor ACCESSION NM_000684 SOURCE ORGANISM human REFERENCE 1 AUTHORS Frielle, Collins, Daniel, Caron, Lefkowitz, Kobilka TITLE Cloning of the cDNA for the human beta 1-adrenergic receptor REFERENCE 2 AUTHORS Frielle, Kobilka, Lefkowitz, Caron TITLE Human beta 1- and beta 2-adrenergic receptors: structurally and functionally related receptors derived from distinct genes

Vilken information lagrar man? 2001-10-01 Vilken information lagrar man? Modell av verkligheten - Entity-Relationship modell (ER) - Unified Modeling Language (UML)

Entity-Relationship entiteter och attribut entitetstyper 2001-10-01 Entity-Relationship entiteter och attribut entitetstyper nyckelattribut relationer kardinalitetsvillkor

Entity-relationship Reference protein-id accession definition source 2001-10-01 Reference protein-id accession definition source article-id title author PROTEIN ARTICLE m n

2001-10-01 Hur lagras informationen? (hög nivå) Hur accessar man informationen? (användarnivå) struktur precision Text (IR) Semistrukturerad data Datamodeller (DB) Regler + Fakta (KB)

Text - Information Retrieval 2001-10-01 Text - Information Retrieval sökning baseras på ord konceptuella modeller: boolesk, vektor, probabilistisk, … filmodell: flat fil, inverterad fil, ...

IR - Filmodell: inverterad fil 2001-10-01 IR - Filmodell: inverterad fil inverterad fil anslagningsfil dokumentfil DOC# WORD HITS LINK LINK DOCUMENTS … … … … … Doc1 adrenergic 32 1 … … … 5 … … Doc2 cloning 53 1 … … … 2 receptor 22 … 5 … … … … …

Vektormodellen (förenklad) 2001-10-01 Vektormodellen (förenklad) Doc1 (1,1,0) cloning receptor adrenergic Doc2 (0,1,0) Q (1,1,1) sim(d,q) = d . q |d| x |q|

Databaser Relationsdatabaser: - modell: tabeller + relationsalgebran 2001-10-01 Databaser Relationsdatabaser: - modell: tabeller + relationsalgebran - frågespråk (SQL) Objektorienterade databaser: - modell: fortlevande objekt, meddelande, inkapsling, ärvning - frågespråk (t.ex. OQL) System: GDB (R), ACEDB (OO)

Relationsdatabaser PROTEIN ACCESSION SOURCE DEFINITION 2001-10-01 PROTEIN ACCESSION SOURCE DEFINITION Homo sapiens adrenergic, beta-1-, receptor NM_000684 human PROTEIN-ID 1 REFERENCE ARTICLE-ID 2 ARTICLE ARTICLE-ID AUTHOR TITLE 1 2 Frielle Collins Daniel Caron Lefkowitz Kobilka Cloning of the cDNA for the human …. Cloning of the cDNA for the human …. Cloning of the cDNA for the human …. Cloning of the cDNA for the human …. Cloning of the cDNA for the human …. Cloning of the cDNA for the human …. Human beta 1- and beta 2-adrenergic receptors Human beta 1- and beta 2-adrenergic receptors Human beta 1- and beta 2-adrenergic receptors Human beta 1- and beta 2-adrenergic receptors

Relationsdatabaser PROTEIN ACCESSION SOURCE DEFINITION 2001-10-01 PROTEIN ACCESSION SOURCE DEFINITION Homo sapiens adrenergic, beta-1-, receptor NM_000684 human PROTEIN-ID 1 REFERENCE ARTICLE-ID 2 ARTICLE-AUTHOR Human beta 1- and beta 2-adrenergic receptors: structurally and functionally related receptors derived from distinct genes ARTICLE-ID TITLE Cloning of the cDNA for the human beta 1-adrenergic receptor ARTICLE-TITLE 1 2 ARTICLE-ID AUTHOR 1 2 Frielle Collins Daniel Caron Lefkowitz Kobilka

SQL select source from protein where accession = NM_000684; PROTEIN 2001-10-01 SQL select source from protein where accession = NM_000684; PROTEIN ACCESSION SOURCE DEFINITION Homo sapiens adrenergic, beta-1-, receptor NM_000684 human PROTEIN-ID 1

SQL select title from protein, article-title, reference 2001-10-01 SQL select title from protein, article-title, reference where protein.accession = NM_000684 and protein.protein-id = reference.protein-id and reference.article-id = article-title.article-id; REFERENCE PROTEIN-ID ARTICLE-ID 1 2 PROTEIN ACCESSION SOURCE DEFINITION Homo sapiens adrenergic, beta-1-, receptor NM_000684 human PROTEIN-ID 1 ARTICLE-TITLE Human beta 1- … ARTICLE-ID TITLE Cloning of the … 1 2

Hur lagras informationen? (låg nivå) 2001-10-01 Hur lagras informationen? (låg nivå) Forsknings- resultat Frågor Svar Modell Databank- system behandling av frågor/uppdateringar Databank- hanterings- system Access till lagrad data Fysiska databanken

2001-10-01

Hur accessar man informationen? (systemnivå) 2001-10-01 Hur accessar man informationen? (systemnivå) Forsknings- resultat Frågor Svar Modell Databank- system behandling av frågor/uppdateringar Databank- hanterings- system Access till lagrad data Fysiska databanken

Hur återställer man en databank efter crash? 2001-10-01 Hur återställer man en databank efter crash? Återställning vid datorstop (system crash) systemfel samtidighetsfel (flera användare) skivfel katastrofer

Hur kan flera användare accessa och uppdatera informationen samtidigt? 2001-10-01 Hur kan flera användare accessa och uppdatera informationen samtidigt? Forsknings- resultat Modell Databank- system Fysiska databanken hanterings- behandling av frågor/uppdateringar Access till lagrad data

Flera användare Administratör 1 Administratör 2 TID 2001-10-01 Flera användare Administratör 1 Administratör 2 TID Read(Antal-proteiner) Antal-proteiner = Antal-proteiner + 30 Read(Antal-proteiner) Antal-proteiner = Antal-proteiner + 25 Write(Antal-proteiner) Write(Antal-proteiner)

Hur kan man accessa informationen i flera databanker samtidigt? 2001-10-01 Hur kan man accessa informationen i flera databanker samtidigt? query

query Answer1 Answer2 Answer3 Sub-query1 Sub-query1 Answer1 Answer2 2001-10-01 query Answer1 Answer2 Answer3 Sub-query1 Sub-query1 Answer1 Answer2 Answer3 Sub-query1 Answer1 Answer2 Answer3

query Answer1.1 Answer1.2 Answer1 Answer2 Answer3 Sub-query2(answer1) 2001-10-01 query Answer1.1 Answer1.2 Answer1 Answer2 Answer3 Sub-query2(answer1) Answer1.1 Answer1.2 Sub-query2(answer1) Sub-query2(answer1) Answer1.1 Answer1.2

query Answer1.1 Answer1.2 Answer1 Answer2 Answer3 Answer2.1 Answer2.2 2001-10-01 query Answer1.1 Answer1.2 Answer1 Answer2 Answer3 Answer2.1 Answer2.2 Sub-query2(answer2) Answer2.1 Answer2.2 Sub-query2(answer2) Sub-query2(answer2) Answer2.1 Answer2.2

query Answer1.1 Answer1.2 Answer1 Answer2 Answer3 Answer2.1 Answer2.2 2001-10-01 query Answer1.1 Answer1.2 Answer1 Answer2 Answer3 Answer2.1 Answer2.2 Answer3.1 Sub-query2(answer3) Answer3.1 Sub-query2(answer3) Sub-query2(answer3) Answer3.1

query result Answer.a Answer1.1 Answer.b Answer1.2 Answer.c Answer.d 2001-10-01 Answer.a Answer.b Answer.c Answer.d Answer.e Answer.f result query Answer1.1 Answer1.2 Answer1 Answer2 Answer3 Answer2.1 Answer2.2 Answer3.1 Subquery3(Answer1.1,Answer1.2, Answer2.1,Answer2.2,Answer3.1) Answer.a Answer.b Answer.c Answer.d Answer.e Answer.f Subquery3(Answer1.1,Answer1.2, Answer2.1,Answer2.2,Answer3.1)

Kursöversikt - FÖ Introduktion Relationsdatabaser och SQL 2001-10-01 Kursöversikt - FÖ Introduktion Relationsdatabaser och SQL Datamodellering, ER/EER diagram Att gå från EER diagram till relationsscheman

Kursöversikt - FÖ Normalisering Datastrukturer för databaser (2) 2001-10-01 Kursöversikt - FÖ Normalisering Datastrukturer för databaser (2) Transaktioner och samtidighet Databasåterställning Information retrieval, semistrukturerad data, objektorienterade databaser Integrering av databaser

Kursöversikt - LA+projekt 2001-10-01 Kursöversikt - LA+projekt Lab1: SQL Lab2: Databasdesign och EER modellering Projekt i bioinformatik genomdatabas proteindatabas enzymdatabas databas för biologiska reglersystem

Kursöversikt - LA+projekt 2001-10-01 Kursöversikt - LA+projekt Rapporteringsdeadline vid varje tentamenstillfälle behövs ett särskilt databaskonto --> automatisk vid registrering på kursen databaskontona tas bort efter 1 år anmälan till laborationer via kurshemsidan skrivarkvota: 300 ’impressions’

Examination skriftlig tenta (praktisk del + teoretisk del) 2001-10-01 Examination skriftlig tenta (praktisk del + teoretisk del) laborationsserie projekt

En kurs för TB Användning i senare kurser + arbete 2001-10-01 En kurs för TB Användning i senare kurser + arbete Unik och eftertraktad kompetens Bio Data Förståelse av modellering + konsekvenser (Hur modellera? Hur ställa frågor? Värför går det långsamt? Varför får man inget svar?...)

2001-10-01 Samläsning

2001-10-01