9 September 2014IS1200 Datorteknik, förel 101 IS1200 Datorteknik Föreläsning 10 1. Processorkonstruktion 2. DMA, Direct Memory Access 3. Byte-code i JAVA.

Slides:



Advertisements
Liknande presentationer
IT för personligt arbete F5
Advertisements

Kap 1 - Algebra och linjära modeller
EDA Digital och Datorteknik
William Sandqvist Datorteknik övning 2 Subrutinanrop William Sandqvist
IE1204 Digital Design Aritmetik Låskretsar, vippor, FSM FSM, VHDL introduktion Asynkron FSM F1 F3 F5 Ö3 F8 F10 F12 Ö8 F2Ö1 Ö2 Ö6 F13 F9Ö5 tentamen William.
IE1204 Digital Design F1 F2 Ö1 Booles algebra, Grindar F3 F4
PC-teknik Repetition enligt önskemål som inkommit via mail. (täcker alltså inte alla moment i kursen)
IS1500 Datorteknik och komponenter
IS1500 Datorteknik och komponenter
IE1206 Inbyggd Elektronik F1 F2
23 August 2014 IS1200 Datorteknik vt09, föreläsning 10, (E och I mfl)1 IS1200 Datorteknik Föreläsning Processorkonstruktion 2. DMA, Direct Memory.
23 August 2014 IS1200 Datorteknik vt2009 föreläsning 7, (E och I m.fl.)1 IS1200 Datorteknik Föreläsning 7 Exceptions vt 2009 (period 3-4) för E och I med.
1 2G1518 Datorteknik Föreläsning 5, våren 2007 Bussar In- och utmatning – I/O Pollning Handskakning.
Denna föreläsning zVad kursen handlar om zKursupplägg, litteratur, bra att veta zPrestanda - ämnet för dagen.
En vanlig femstegspipeline FDEMW FDEMW FDEMW FDEMW tid.
En vanlig femstegspipeline FDEMW FDEMW FDEMW FDEMW tid.
IE1206 Inbyggd Elektronik F1 F2
IE1206 Inbyggd Elektronik F1 F2
Att skapa Siv Strömquist (2000)
IS1200 Föreläsning 10 Mats Brorsson, KTH /ICT Programvaru- och datorsystem SICS – Swedish Institute of Computer Science.
Datorteknik v3 Datorteknik 1A Kapitel 2-3.
IS1500 Datorteknik och komponenter
Streams and File I/O Kapitel 10. Agenda Exceptions Textfiler Skriva Appenda Läsa File Sökvägar.
Silberschatz, Galvin and Gagne ©2009 Operating System Concepts – 8 th Edition, Kapitel 13: I/O-system.
Perspektivplan 2025 DISPOSITION Energi- och klimatpolitiken
BANRITNINGSUNDERLAG Detta är inget fullständigt ”banritningsprogram” utan ett underlag i Powerpoint-format med skyltar för att rita Rallylydnadsbanor.
IE1206 Inbyggd Elektronik F1 F2
Abelli, B. (2004). Programmeringens Grunder – med exempel i C#. Lund: Studentlitteratur 1 De bifogade OH-bilderna är bara utkast till vad som kan vara.
IF1330 Ellära F/Ö1 F/Ö2 F/Ö3 Strömkretslära Mätinstrument Batterier
Digital och Datorteknik – EDA / Mikroprogrammering EDA Digital och Datorteknik 2009/2010 Mikroprogrammering Arbetsboken, avsnitt 28.
2G1510 Datorteknik fk Föreläsning 1, hösten 2003.
William Sandqvist PIC PIC (Peripheral Interface Computer) är en datorkrets med ”allt i ett”. Prog Mem. Programminnet är 2048 instruktioner.
IF1330 Ellära F/Ö1 F/Ö2 F/Ö3 Strömkretslära Mätinstrument Batterier
IF1330 Ellära F/Ö1 F/Ö2 F/Ö3 Strömkretslära Mätinstrument Batterier
31 March 2015IS1200 Datorteknik, förel 101 IS1200 Datorteknik Föreläsning Processorkonstruktion 2. DMA, Direct Memory Access 3. Byte-code i JAVA.
31 March 2015 IS1500 Datorteknik o k, föreläsning CE - F61 IS1500 Datorteknik och komponenter Föreläsning 6 Bushantering In- och utmatning, I/O Programstyrd.
William Sandqvist Övning 8 Minnessystem Lokalitet Cacheminnen William Sandqvist
31 March 2015 IS1200 Datorteknik ht2009 föreläsning 2, (D2)1 IS1200 Datorteknik Föreläsning 2 Vi bygger en processor Kursboken, valda delar av kapitel.
IS1200 Datorteknik Föreläsning CE F2 Vi bygger en processor Kursboken, delar av kapitel 7 31 March IS1200 Datorteknik föreläsning CE – F2.
1 386 Från s bits adressbuss –=>4GB minne kan adresseras 32 bits databuss max klockfrekvens: 40MHz Protected mode –virtuellt minne –segmentering.
Anders Sjögren Går det att simulera vår värld med 1:or och 0:or ?
Pipelining Föreläsning 4. T exe — CPU-exekveringstid I — Antalet exekverade instruktioner CPI — Genomsnittligt antal klockcykler per instruktion T c —
Emulatorkonstruktion Schema Inledning Andra metoder Mina metoder Demonstration av min C64-emulator Sammanfattning och frågor.
Digitalteknik 7.5 hp distans: 4.6 Adderare 4.45 Adderare Addition av två tal innebär att samma förfarande upprepas för varje position i talet. För varje.
2 April 2015 IS1200 Datorteknik o k, föreläsning CE - F31 IS1200 Datorteknik Föreläsning CE F3 Metoder / subrutiner Kursboken, delar av kapitel 4.
Antalet operander/instruktion z0 - stackmaskin yADD - adderar värdena överst på stacken, tar bort dem och lägger dit summan z1 - ackumulatormaskin yADD.
2G1518 Datorteknik Föreläsning 5 Bussar In- och utmatning (Input/Output, I/O) Programstyrd pollning hösten 2005 för D3 och CLMDA m fl.
3 April 2015IS1200 Datorteknik, föreläsning 61 IS1200 Datorteknik Föreläsning 6 Bushantering In- och utmatning, I/O Programstyrd pollning.
22 April 2015IS1200 Datorteknik, föreläsning 11 IS1200 Datorteknik Föreläsning 1 Introduktion.
William Sandqvist Datorteknik övning 1 Introduktion till assemblerprogrammering av Nios II William Sandqvist
1 June 20152G1502, föreläsning 3, vt G1502 Datorteknik allmän kurs Föreläsning 3 Metoder och subrutiner Kursboken, valda delar av kapitel 4 version.
1 June G1518, Förel 10, ht2005 (D3/CLMDA)1 2G1518 Datorteknik, ht 2005 version för D3 och CLMDA Föreläsning Processorkonstruktion 2. DMA, Direct.
1 June G1502, Föreläsning 9, vt2004 för IT1 2G1502 Datorteknik allmän kurs Föreläsning 9 1. Processorkonstruktion 2. DMA, Direct Memory Access 3.
2 June G1502, Föreläsning 8, vt2004 för E och I1 2G1502 Datorteknik allmän kurs Föreläsning 8 Processorkonstruktion DMA, Direct Memory Access.
6/3/2015© Mats Brorsson1 Hur mycket snabbare blir det med PC133 SDRAM jämfört med PC100 SDRAM?... blir det med en 1,4 GHz Athlon- processor jämfört.
10 June G1518, föreläsning 3, vt2007 (E/I/CLMDA)1 2G1518 Datorteknik Föreläsning 3 Metoder / subrutiner Kursboken, valda delar av kapitel 4 vt 2007.
12 June G1518, Föreäsningl 8, vt07 (E/I/CL)1 2G1518 Datorteknik Föreläsning 8 Cache Memory vt 2007 (period 3-4) för E, I och CLMDA.
William Sandqvist Övning 10 Processorkonstruktion med pipe-line.
1 2G1502 Datorteknik allmän kurs Föreläsning 3 Programmering med hopp Programmering av Nios.
14 July 2015 IS1200/2G1518 Datorteknik, föreläsning 2, ht2007 (D2)1 IS1200 Datorteknik Föreläsning 2 Vi bygger en processor Kursboken, valda delar av kapitel.
16 July 2015 IS1500 Datorteknik och komponeneter, föreläsning DC-F2 1 IS1500 Datorteknik och komponenter Föreläsning DC F2 Kretsar med återkoppling Minnen.
30 July 2015 IS1200 Datorteknik föreläsning CE - F11 IS1200 Datorteknik Föreläsning CE F1 Computer Engineering Introduktion.
31 July 2015IS1200 Datorteknik, förel 101 IS1200 Datorteknik Föreläsning Processorkonstruktion 2. DMA, Direct Memory Access 3. Byte-code i JAVA.
4 August 2015 IS1200 Datorteknik föreläsning CE - F91 IS1200 Datorteknik Övning 10.
William Sandqvist Övning 10 Processorkonstruktion med pipe-line.
15 August 2015 IS1200 Datorteknik föreläsning CE - F11 IS1200 Datorteknik Föreläsning CE F1 Computer Engineering Introduktion.
William Sandqvist KIA’s fabrik i Slovenien En bil i minuten lämnar bandet – tar det en minut att bygga en bil? Nej för KIA's fabrik utanför.
3 October 2015 IS1200 Datorteknik ht2009 föreläsning 3, (D2)1 IS1200 Datorteknik Föreläsning 3 Metoder / subrutiner Kursboken, valda delar av kapitel 4.
Grundläggande datavetenskap, 4p
Presentationens avskrift:

9 September 2014IS1200 Datorteknik, förel 101 IS1200 Datorteknik Föreläsning Processorkonstruktion 2. DMA, Direct Memory Access 3. Byte-code i JAVA

IS1200 Datorteknik Assemblerprogram C In- och utmatning Avbrott och "trap" Cacheminnen Trådar, synkronisering CE F1 CE F3 CE F4 CE F5 CE F6 CE F7 CE F8 CE F9 CE F2 CE Ö4 CE Ö1 CE Ö2 CE Ö3 CE Ö7 CE Ö8 CE Ö9 CE Ö5CE Ö6 lab nios2time hemlab C lab nios2io lab nios2int hemlab cache hemlab trådar CE F10CE Ö10 tentamen 9 September 20142IS1200 Datorteknik, förel 10

9 September 2014IS1200 Datorteknik, förel 103 Viktiga delar i en dator CPU MEM BUS I/O program data

9 September 2014IS1200 Datorteknik, förel 104 Programexekvering FETCH (update PC) (decode) EXECUTE

9 September 2014IS1200 Datorteknik, förel Processorkonstruktion Kursboken kap 7,  Jämför innehåll i föreläsningar och kursboken  4 stegs PIPE-LINE  5 stegs PIPE-LINE  Fenomen vid konstruktion med PIPE-LINE  Avsnitt 9.3, sid

9 September 2014IS1200 Datorteknik, förel 106 CPU med 4 steg Execute Fetch Operand Write Back Fetch Instruction Register File 32 x 32 Program Memory n x 16 ALU Register File 32 x 32 PC

9 September 2014IS1200 Datorteknik, förel 107 Pipeline med register och kombinatorik ALU PC ADD IR0 IR1 IR2 +2 REGISTER KOMBINATORIK REGISTER KOMBINATORIK REGISTER

9 September 2014IS1200 Datorteknik, förel stegs CPU Konsekvent synkronism Förbered skrivning till Register File FIFOEXEWB ALU arbetar / D-Cache arbetar Avkoda samt Leta fram operander Leta fram instruktion ur I-cache Skriv resultat till Register File Skrivning till tmp-reg Skriv oprander till ALU-register Skrivning till Instruction Register Skrivning till Program Counter clock

9 September 2014IS1200 Datorteknik, förel 109 Execute Fetch Operand Write Back Fetch Instruction Register File 32 x 32 Program Memory n x 16 ALU Register File 32 x 32 PC NYTT IR0 IR1 IR2 PIPE - LINE införs ! 2 nya (del-) register IR

9 September 2014IS1200 Datorteknik, förel stegs CPU utan och med PIPE-LINE FIFOEXEWBFIFOEXEWBFIFOEXEWBFIFOEXEWBFIFOEXEWBFIFOEXEWB Utan PIPE-LINE Med PIPE-LINE

9 September 2014IS1200 Datorteknik, förel 1011 Processor med 4 stegs PIPE-LINE Hur lång tid tar varje instruktion, 4 cykler Antal Cykles Per Instruction, CPI, 1 cykel Antal instruktioner per cykel, 1 instruktion FIFOEXEWBFIFOEXEWBFIFOEXEWB

9 September 2014IS1200 Datorteknik, förel 1012 Fenomen pga PIPE-LINE 1. Branch Delay 2. Data Dependency 3. Load Delay

9 September 2014IS1200 Datorteknik, förel 1013 Fenomen pga PIPE-LINE 1.Branch Delay (slot) Instruktionen i minnespositionen närmast efter en hoppinstruktion hämtas och utföras innan hoppet verkställs Programexempel 16: BEQ R1, R2, 64# offset lagras i binärkod 20: ADD …# hämtas och utförs 24: … … 84: SUB...

9 September 2014IS1200 Datorteknik, förel 1014 Efter FI av 16: BEQ 64 Execute Fetch Operand Write Back Fetch Instruction 16: BEQ 64 20: ADD... ALU ADD IR0 IR1 IR2 20 BEQ : BEQ R1, R2, 64 20: ADD … 24: … … 84: SUB … 88:... Register File 32 x 32 Register File 32 x 32 PC PC+4 PC+Imm 20

9 September 2014IS1200 Datorteknik, förel 1015 Hur undviks Branch Delay Slot Hur utnyttjas Branch Delay Slot Olika metoder: zFyll ut med 1 NOP (onyttig) zSkriv en (nyttig) instruktion i hoppluckan zKompilator/Programmerare väljer zLåt hårdvaran specialbehandla hopp (hoppgissning / invalidate /...)

9 September 2014IS1200 Datorteknik, förel 1016 Fenomen pga PIPE-LINE 2. Data Dependency RAW - Read After Write Instruktioner som läser från ett register strax efter en instruktion som skriver till samma register kan få fel värde Programexempel 44:ADD R1 <- R2 + R3 48:ADD R4 <- R5 + R6 52:ADD R7 <- R1 + R4

9 September 2014IS1200 Datorteknik, förel 1017 Data Dependencies med 4 stegs PIPE-LINE 44: ADD... 48: ADD... FIFOEXEWBFIFOEXEWBFIFOEXEWB 44:ADD R1 <- R2 + R3 48:ADD R4 <- R5 + R6 52:ADD R7 <- R1 + R4 52: ADD... R4 skrivs till RegFile Gamla värden R1 och R4 läses från RegFile R1 skrivs till RegFile

9 September 2014IS1200 Datorteknik, förel 1018 RAW Dependency med 4 stegs PIPE-LINE  Skrivning till register sker i WB-steget  Läsning från register sker i FO-steget  Skrivning måste ske innan läsning  WB-steg måste ligga före FO-steg  Genom att placera 2 NOP:ar eller 2 ”oberoende” instruktioner mellan WB och FO kan man lösa RAW-konflikten

9 September 2014IS1200 Datorteknik, förel : ADD... 48: ADD... FIFOEXEWBFIFOEXEWBFIFOEXEWB 44:ADD R1 <- R2 + R3 48:ADD R4 <- R5 + R6 NOP NOP 60:ADD R7 <- R1 + R4 60: ADD... R4 skrivs till RegFile Nya värden i R1 och R4 läses från RegFile R1 skrivs till RegFile FIFOEXEWBFIFOEXEWB NOP

9 September 2014IS1200 Datorteknik, förel 1020 Data Dependencies Execute Fetch Operand Write Back Fetch Instruction Register File 32 x 32 Program Memory n x 16 ALU Register File 32 x 32 IR0 IR1 IR2 44: R1 <- R2+R3 46: R4 <- R5+R6 48: R7 <- R1+R4 ADD PC+n PC+Imm

9 September 2014IS1200 Datorteknik, förel 1021 Data Dependencies inför nya data-vägar Execute Fetch Operand Write Back Fetch Instruction Register File 32 x 32 Program Memory n x 16 ALU Register File 32 x 32 IR0 IR1 IR2 44: R1 <- R2+R3 46: R4 <- R5+R6 48: R7 <- R1+R4 ADD PC+n PC+Imm NYTT

9 September 2014IS1200 Datorteknik, förel 1022 Data Dependencies med 4 stegs PIPE-LINE 44: ADD... 48: ADD... FIFOEXEWBFIFOEXEWBFIFOEXEWB 52: ADD... R4 skrivs till RegFile Ny värden R1 och R4 läses via nya datavägar R1 skrivs till RegFile 44:ADD R1 <- R2 + R3 48:ADD R4 <- R5 + R6 52:ADD R7 <- R1 + R4

9 September 2014IS1200 Datorteknik, förel 1023 LOAD och STORE  Vi vill kunna utföra instruktionerna LOADR dst, [ R addr ] STORE [ R addr ], R src  Indirekt adressering via register

9 September 2014IS1200 Datorteknik, förel 1024 ALU/EXEWB Register File 32 x 32 Program Memory n x 16 ALU Register File 32 x 32 ADD IR0 IR1 IR2 RWM 4 stegs PIPE-LINE dataminne (data cache) Instruction Decode Fetch Operand Instruction Fetch PC+n PC+Imm

9 September 2014IS1200 Datorteknik, förel 1025 LOAD och STORE med 4 stegs PIPE-LINE LOAD to Rd USE Rd FIFO MEM WBFIFOEXEWB Data från MEM finns tillgängligt Data från MEM finns ej tillgängligt för FO

9 September 2014IS1200 Datorteknik, förel 1026 Data Dependencies: rita in data forwarding igen Register File 32 x 32 Program Memory n x 16 ALU Register File 32 x 32 PC IR0 IR1 IR2 44: R1 <- R2+R3 46: R4 <- R5+R6 48: R7 <- R1+R RWM ALU/EXEWBInstruction Decode Fetch Operand Instruction Fetch Rätta till NYTT

9 September 2014IS1200 Datorteknik, förel 1027 LOAD och STORE med 4 stegs PIPE-LINE LOAD to Rd USE Rd FIFO MEM WBFIFOEXEWB Data från MEM finns tillgängligt Data från MEM finns tillgängligt för FO tack vare Data Forward

9 September 2014IS1200 Datorteknik, förel 1028 LOAD och STORE  Vi vill kunna utföra instruktionerna LOADR dst, Offset[ R addr ] STOREOffset[ R addr ], R src  Indexerad adressering

9 September 2014IS1200 Datorteknik, förel 1029 ALU/EXE/MEMWB Register File 32 x 32 Program Memory n x 16 ALU Register File 32 x 32 ADD IR0 IR1 IR2 RWM 4 stegs PIPE-LINE dataminne (data cache) Instruction Decode Fetch Operand Instruction Fetch PC+n PC+Imm

9 September 2014IS1200 Datorteknik, förel 1030 CPU med 5 stegs PIPE-LINE ALU/EXEInstruction Decode Fetch Operand MEMInstruction Fetch Register File 32 x 32 Program Memory n x 16 ALU PC ADD IR0 IR1 IR2 RWM IR3 Write Back Register File 32 x 32 PC+n PC+Imm NYTT

9 September 2014IS1200 Datorteknik, förel 1031 Processor med 5 stegs PIPE-LINE LOAD FIFOALUWB MEM FIFOALUWB MEM ADD Hur lång tid tar varje instruktion, 5 cycles Cykles Per Instruction, CPI, 1 cycle Antal instruktioner per cykel, 1 instruktion FIIDEXEWB MEM Jämför med Figur 7.12 i kursboken, sid 255

9 September 2014IS1200 Datorteknik, förel 1032 LOAD och STORE med 5 stegs PIPE-LINE LOAD to Rd FIFOALUWB MEM FIFOALUWB MEM USE Rd Data från MEM finns tillgängligt Data från MEM finns ej tillgängligt för FO

9 September 2014IS1200 Datorteknik, förel 1033 Fenomen pga PIPE-LINE 2. Data Dependency Instruktioner som läser från ett register strax efter en instruktion som skriver till samma register kan få fel värde Programexempel 44:ADD R1  R2 + R3 48:ADD R9  R5 + R6 52:ADD R7  R0 + R4 56:ADD R8  R1 + R7

9 September 2014IS1200 Datorteknik, förel 1034 med 5 stegs PIPE-LINE 44: ADD... 48: ADD... 44:ADD R1  R2 + R3 48:ADD R9  R5 + R6 52:ADD R7  R0 + R4 56:ADD R8  R1 + R7 52: ADD... R9 skrivs till RegFile R1 och R7 läses från RegFile R1 skrivs till RegFile FIFOEXEWB MEM FIFOEXEWB MEM FIFOEXEWB MEM FIFOEXEWB MEM R7 skrivs till RegFile 56: ADD...

9 September 2014IS1200 Datorteknik, förel 1035 Data Dependencies med 5 stegs PIPE-LINE  Skrivning till register sker i WB-steget  Läsning från register sker i FO-steget  Skrivning måste ske innan läsning  WB-steg måste ligga före FO-steg  Genom att placera 3 NOP:ar eller 3 ”oberoende” instruktioner mellan WB och FO kan man lösa RAW-konflikten

9 September 2014IS1200 Datorteknik, förel : 48: 44:ADD R1  R2 + R3 48:ADD R9  R5 + R6 52:ADD R7  R0 + R4 NOP ADD R8  R1 + R7 52: R4 skrivs till RegFile R1 och R7 läses från RegFile R1 skrivs till RegFile FIFOEXEWB MEM FIFOEXEWB MEM FIFOEXEWB MEM FIFOEXEWB MEM R7 skrivs till RegFile 68: ADD... FIFOEXEWB MEM FIFOEXEWB MEM FIFOEXEWB MEM NOP

9 September 2014IS1200 Datorteknik, förel 1037 inför nya data-vägar Register File 32 x 32 Program Memory n x 16 ALU PC ADD IR0 IR1 IR2 IR3 +2 Register File 32 x 32 RWM NYTT

9 September 2014IS1200 Datorteknik, förel 1038 Fenomen pga PIPE-LINE 3. Load Delay LOAD reg FIFOALUWB MEM USE reg Tillgängligt från minne FIFOALUWB MEM Skriv till ALU-reg (Gammalt registervärde)

9 September 2014IS1200 Datorteknik, förel 1039 Load Delay i 5-stegs pipe även vid Data Forward LOAD reg FIFOALUWB MEM ADD reg FIFOALUWB MEM Skriv till ALU-reg Data Forward fungerar FIFOALUWB MEM Oberoende instr. Tillgängligt från minne

9 September 2014IS1200 Datorteknik, förel Block Data Transfer - BDT  Kopiera ett antal ord, ett Block (t.ex. 1024x8)  från minne till minne [memcpy(dst,src,num)]  från I/O till minne  från minne till I/O  från I/O till I/O Typexempel mellan MM och SS dvs Main Memory och Secondary Storage dvs mellan ”hårddisk och RAM-minne”

9 September 2014IS1200 Datorteknik, förel 1041 BDT: minne till minne MEM SrcAddr NrOfTransfers DstAddr Det behövs 2 adresspekare Käll-adress och Destinations-adress Det behövs en räknare, antal kopieringar Var lagras pekare och räknare ? I register eller i minne! beroende på metod!

9 September 2014IS1200 Datorteknik, förel 1042 BDT: minne till minne CPU MEM BUS I/O

9 September 2014IS1200 Datorteknik, förel 1043 memcpy i C-kod (~ Bilting sid 250) void* memcpy (void* dst, const void* src, size_t nr) { char * dp = (char*) dst; /* type cast from void */ char * sp = (char*) src; /* type cast from void */ register int i; for (i=0; i<nr, i=i+1) { *dp = *sp; /* copy */ dp=dp+1; sp += 1; /* update pointers */ } }

9 September 2014IS1200 Datorteknik, förel 1044 BDT: minne till I/O BDT: I/O till minne CPU MEM BUS I/O

9 September 2014IS1200 Datorteknik, förel 1045 BDT: I/O till I/O CPU BUS I/O

9 September 2014IS1200 Datorteknik, förel 1046 BDT - Block Data Transfers Block Data Transfer utförs i tre olika del-moment  Initiera: pekare och räknare, mm  Kopiera: en enhet i taget (byte/word)  Avsluta: bokföring (i OS) att block är kopierat (OS = Operativ Systemet)

9 September 2014IS1200 Datorteknik, förel 1047 BDT - Block Data Transfers Block Data Transfer kan utföras med tre olika metoder 1. Program-styrd Block Data Transfer 2. Avbrotts-styrd Block Data Transfer 3. DMA-styrd Block Data Transfer (DMA - Direct Memory Access)

9 September 2014IS1200 Datorteknik, förel Program-styrd BDT source to destination  Programstruktur initiera pekare och räknare loop:kopiera en enhet (byte/word) br loop om ej klart avsluta

9 September 2014IS1200 Datorteknik, förel Programstyrd BDT source to destination # Initiera inför programmerad BDT # pekare och räknare i ”vanliga” CPU-register moviar8, SrcAddr moviar9, DstAddr moviar10, NrOfTransfers

9 September 2014IS1200 Datorteknik, förel Program-styrd BDT Memory to Memory # Kopiera i programslinga.equwordsize, 4 bler10, r0, out# ”empty” loop:ldwr11, 0(r8)# läs data stwr11, 0(r9)# skriv data addir8, r8, wordsize# öka läsadress addir9, r9, wordsize# öka skrivadress subir10, r10, 1# minska räknare bgtr10, r0, loop# hoppa om ej klart out:bravsluta# hopp till OS

9 September 2014IS1200 Datorteknik, förel Program-styrd BDT I/O to Memory Antag att I/O-porten är en ”vanlig” inport med en signal av typen IBF - Input Buffer Full IBF ettställs varje gång det finns nya data att läsa från inporten

9 September 2014IS1200 Datorteknik, förel 1052 IN-port RD IN-PORT IBFWRIN-DATA RD IBF Adress Data Control CPU-BUSS IN 0 IN n DnDn D0D0 IN 1 D1D1 Q Q’ set clear IBF WR RD vippa grindar &&&......

9 September 2014IS1200 Datorteknik, förel 1053 BDT: I/O till minne CPU MEM I/O SrcAddr DstAddr NrOfTransfers

9 September 2014IS1200 Datorteknik, förel 1054 Block Data Transfer I/O to Memory # Kopiera i programslinga (nästan likadan).equwordsize, 4 loop:callgetdata# blocking on IBF stwr2, 0(r9)# skriv data #addir8, r8, wordsize# öka ej läsadress addir9, r9, wordsize# öka skrivadress subir10, r10, 1# minska räknare bgtr10, r0, loop# hoppa om ej klart bravsluta# hopp till OS

9 September 2014IS1200 Datorteknik, förel Program-styrd BDT Memory to I/O Antag att I/O-porten är en ”vanlig” utport med en signal av typen OBE - Output Buffer Empty OBE ettställs varje gång det går att skriva till utporten

9 September 2014IS1200 Datorteknik, förel 1056 Block Data Transfer Memory to I/O # Kopiera i programslinga (nästan likadan).equwordsize, 4 loop:ldwr4, 0(r8)# läs data callputdata# blocking on OBE addir8, r8, wordsize# öka läsadress #addir9, r9, wordsize# öka ej skrivadress subir10, r10, 1# minska räknare bgtr10, r0, loop# hoppa om ej klart bravsluta# hopp till OS

9 September 2014IS1200 Datorteknik, förel 1057 Block Data Transfer I/O to I/O # Kopiera i programslinga (nästan likadan).equwordsize, 4 loop:callgetdata# blocking on IBF movr4, r2# flytta parameter callputdata# blocking on OBE # addir8, r8, wordsize# öka ej läsadress #addir9,r9, wordsize# öka ej skrivadress subir10, r10, 1# minska räknare bgtr10, r0, loop# hoppa om ej klart bravsluta# hopp till OS

9 September 2014IS1200 Datorteknik, förel Avbrotts-styrd BDT I/O to Memory Typ-exempel: Kopiera från hårddisk till ram-minne Antag att hårddisken levererar data via en ”vanlig” inport med en signal IBF IBF ettställs varje gång det finns nya data IBF genererar avbrottsbegäran, IRQ

9 September 2014IS1200 Datorteknik, förel Avbrotts-styrd Block Data Transfer source to destination # Initiera inför avbrotts-styrd BDT # pekare och räknare kan inte lagras i ”vanliga” CPU-register utan måste lagras i minnet. moviar8, SrcAddr# måste ändras moviar9, DstAddr# måste ändras moviar10, NrOfTransfers# måste ändras

9 September 2014IS1200 Datorteknik, förel 1060 BDT: I/O till minne med avbrott (IBF ger IRQ) CPU MEM I/O SrcAddr DstAddr NrOfTransfers IBF=IRQ

9 September 2014IS1200 Datorteknik, förel Avbrotts-styrd BDT I/O to Memory Initiera inför avbrotts-styrd BDT # storei Addr, Imm är ett macro som skriver värdet Imm till minnet på adress Addr  storeiSrcAddrPoint, SrcAddrValue  storeiDstAddrPoint, DstAddrValue  storeiNrOfTransf, NrOfTransfValue Det behövs alltså 3 reserverade platser i minnet Det går ej att använda register !? (varför?)

9 September 2014IS1200 Datorteknik, förel Avbrotts-styrd BDT I/O to Memory zProgramstruktur initiera: programsnutt i OS kopiera: Exceptionhandler, inth, anropas vid avbrott dvs då IBF = 1 inth:subi ea, ea, 4 kopiera en enhet# se nästa sida eret# retur från int avsluta:brOS-avsluta# hopp till OS

9 September 2014IS1200 Datorteknik, förel Avbrotts-styrd BDT I/O to Memory #kopiera en enhet# se denna sida inth: loadiar8, SrcAddrPoint# hämta läsadress loadia r9, DstAddrPoint# hämta skrivadress ldwr11, 0(r8)# läs data från INPORT stwr11, 0(r9)# skriv data till minne loadiar10, NrOfTranf# hämta räknare subir10, r10, 1# uppdatera räknare beqr10, r0, avsluta# hopp till OS # forts.

9 September 2014IS1200 Datorteknik, förel Avbrotts-styrd BDT I/O to Memory  Avbrottsrutin forts. #addir8, r8, wordsize# öka läsadress, nej ! addir9, r9, wordsize# öka skrivadress, ja ! # storiar8, SrcAddrPoint# skriv EJ tillbak läsadress storiar9, DstAddrPoint# skriv tillbaks skrivadress storiar10, NrOfTrans# skriv tillbaks räknare subi ea, ea, 4# om det inte är gjort eret# from interrupt

9 September 2014IS1200 Datorteknik, förel BDT: I/O till minne med avbrott (IBF ger IRQ) CPU MEM I/O SrcAddr DstAddr NrOfTransfers IBF=IRQ

9 September 2014IS1200 Datorteknik, förel BDT: I/O till minne med DMA (IBF ger DMARQ) CPU MEM DMA Bus Arbiter BR BG MEM I/O SrcAddr DstAddr NrOfTransfers DMARQ

9 September 2014IS1200 Datorteknik, förel 1067 Bus Arbiter krävs Bus Request / Bus Grant CPU MEM BUS I/O DMA Bus Arbiter BR BG

9 September 2014IS1200 Datorteknik, förel 1068 Bus-ledningar Om det finns fler än en Master krävs Bus Arbiter (bus-fördelare)  Signal (er) av typ Bus Request  Signal (er) av typ Bus Grant

9 September 2014IS1200 Datorteknik, förel 1069 DMA - Direct Memory Address  DMARQ - DMA ReQuest (ny signal)  Source Address Register  Destination Address Register  Byte/Word Count Register  Control Register  Block Size: Byte Count or End Of Block

9 September 2014IS1200 Datorteknik, förel BDT: I/O till minne med DMA (IBF ger DMARQ) CPU MEM DMA Bus Arbiter BR BG MEM I/O SrcAddr DstAddr NrOfTransfers DMARQ

9 September 2014IS1200 Datorteknik, förel DMA-styrd BDT I/O to Memory zProgramstruktur initiera... DMA:kopiera en enhet avsluta: Meddela att det är klart ? Hur? Vart?

9 September 2014IS1200 Datorteknik, förel 1072 Block Data Transfer I/O to Memory # Initiera inför DMA-styrd BDT # DmaSrc, -Dst, -Nr och -Ctl är memory-mapped register i DMA storeiDmaSrc, SrcAddrVal storeiDmaDst, DstAddrVal storeiDmaNr, NrOfTransfers storeiDmaCtl, DirandSize

9 September 2014IS1200 Datorteknik, förel 1073 DMA - Direct Memory Address Operativsystemets åtgärder för att genomföra BDT med DMA Initiera: register i DMA och starta DMA Kopiera: sköts av DMA ”i bakgrunden” med ”cycle stealing på bussen” Avsluta: Avbrott från DMA leder till br avsluta# hopp till OS Bokför att BDT är fullföljd, ”stäng DMA”

9 September 2014IS1200 Datorteknik, förel 1074 BDT - Block Data Transfers Block Data Transfer kan utföras med tre olika metoder 1. Program-styrd Block Data Transfer upptar 100% av CPU-tid (sämst metod) 2. Avbrotts-styrd Block Data Transfer upptar < 100% av CPU-tid (bättre) 3. DMA-styrd Block Data Transfer upptar << 100% av CPU-tid (bäst)

9 September 2014IS1200 Datorteknik, förel BDT: I/O till minne med program (pollning av IBF) CPU MEM DMA Bus Arbiter BR BG MEM I/O SrcAddr DstAddr NrOfTransfers

9 September 2014IS1200 Datorteknik, förel BDT: I/O till minne med avbrott (IBF ger IRQ) CPU MEM DMA Bus Arbiter BR BG MEM I/O SrcAddr DstAddr NrOfTransfers IRQ

9 September 2014IS1200 Datorteknik, förel BDT: I/O till minne med DMA (IBF ger DMARQ) CPU MEM DMA Bus Arbiter BR BG MEM I/O SrcAddr DstAddr NrOfTransfers DMARQ

9 September 2014IS1200 Datorteknik, förel 1078 IS1200 Datorteknik allmän kurs Föreläsning 10 byte-code i JAVA metoden ”tick”

9 September 2014IS1200 Datorteknik, förel 1079 Något om Java  Editering av textfil, fil.java  Kompilering till Byte-code, fil.class  Interpretering av Byte-code med  JVM - Java Virtual Machine

9 September 2014IS1200 Datorteknik, förel 1080 Programutveckling Assembler-kod Ass-program Text-fil Object-modul ”Text-fil” Ass-program Text-fil Object-modul ”Text-fil” Ladd-modul ”Text-fil” Ass-program Text-fil Object-modul ”Text-fil” Ass-program Text-fil Object-modul ”Text-fil”

9 September 2014IS1200 Datorteknik, förel 1081 Assemblering; översätter Nios-kod till Assembler-kod Nios-program Text-fil Ladd-modul assemblering / översättning och länkning fil.asm, kan redigeras med en editor fil.objdump kan ej redigeras med en editor kan laddas ner till datorn minne

9 September 2014IS1200 Datorteknik, förel 1082 Programexekvering Nios-kod (Intel, …) FETCH (update PC) (decode) EXECUTE Hårdvara

9 September 2014IS1200 Datorteknik, förel 1083 C++ program Text-fil Ass-program Text-fil Object-modul ”Text-fil” C-program Text-fil Ass-program Text-fil Object-modul ”Text-fil” Ladd-modul ”Text-fil” Ass-program Text-fil Object-modul ”Text-fil” Pascal-program Text-fil Ass-program Text-fil Object-modul ”Text-fil” BLANDAD KOD

9 September 2014IS1200 Datorteknik, förel 1084 Ass-program Text-fil Object-modul ”Text-fil” C-program Text-fil Ass-program Text-fil Object-modul ”Text-fil” Ladd-modul ”Text-fil” Ass-program Text-fil Object-modul ”Text-fil” Ass-program Text-fil Object-modul ”Text-fil” BLANDAD KOD JAVA-program Text-fil C++ program Text-fil

9 September 2014IS1200 Datorteknik, förel 1085 Alt1: Kompilering; översätter java-kod till Assembler-kod java-program Text-fil Nios-code kompilering / översättning fil.java, kan redigeras med en editor fil.objdump, kan ej redigeras med en editor kan laddas ner till datorns minne

9 September 2014IS1200 Datorteknik, förel 1086 Alt2: Kompilering; översätter java-kod till byte-kod java-program Text-fil Byte-code kompilering / översättning fil.java, kan redigeras med en editor fil.class, kan ej redigeras med en editor kan laddas ner till datorn minne

9 September 2014IS1200 Datorteknik, förel 1087 Programexekvering byte-kod (Intel, …) FETCH (update PC) (decode) EXECUTE Mjukvara JVM - Java Virtual Machine

9 September 2014IS1200 Datorteknik, förel 1088 Java Virtual Machine interpreterar byte-code do { fetch an opcode; if (operands) fetch operands; execute the action for the opcode } while (there is more to do);

9 September 2014IS1200 Datorteknik, förel 1089 Fetch - Decode - Execute ADD ?LD ?AND ?BR ? Exec ADD Exec LD Exec AND Exec BR JA NEJ... ILLEGAL JA Fetch Update PC

9 September 2014IS1200 Datorteknik, förel 1090 Java Virtual Machine interpreterar byte-code Interpretering Plattforms-oberoende Byte-code flyttbar JVM Java Virtual Machine Plattforms-beroende

9 September 2014IS1200 Datorteknik, förel 1091 Interpretering  Fetch och Execute görs med programvara  Java har översatts till Byte-Code  Byte-Code är en ”följd av instruktioner”  Varje processor (Nios, MIPS, x86) har en egen JVM (som exekveras i maskinkod)  JVM kan skrivas i C (eller pascal eller java) och kompileras/assembleras till Nios/MIPS

9 September 2014IS1200 Datorteknik, förel 1092 Programexempel, ass-code C-koden zC = A + B ; översätts till hex-code (”nios-assembler”) zLOADR1 <-- A zLOADR2 <-- B zADDR3 <-- R1 + R2 zSTOREC <-- R3

9 September 2014IS1200 Datorteknik, förel 1093 Programexempel, byte-code Java-koden zC = A + B ; översätts till byte-code (”java-assembler”) zPUSHA;kopiera från minne till stack zPUSHB;kopiera från minne till stack zADD;”operera på stacken” zPOPC;kopiera från stack till minne

9 September 2014IS1200 Datorteknik, förel 1094 Operera på stack Addition av heltal ADDera de två översta int på stacken zPOP till ALU-A zPOP till ALU-B zaddera från ALU-A och ALU-B till tmp-reg zPUSH från tmp-reg

9 September 2014IS1200 Datorteknik, förel 1095 Java-program steg vid program-arbete  Skriv källkod i JAVA, plattforms-oberoende och flyttbart  kompilera till byte-code, plattforms- oberoende och flyttbart  Interpretera byte-code med JVM  JVM = Java Virtual Machine, plattforms-beroende

9 September 2014IS1200 Datorteknik, förel 1096 funktionen tick i java-kod (obs parameter ej pekare utan värde) Class Tick { public int tick (int time) {time = time + 1; if ((time & 0x000F) == 0x000A) time = time - 0x000A + 0x0010; if ((time & 0x00F0) == 0x0060) time = time - 0x x0100; if ((time & 0x0F00) == 0x0A00) time = time - 0x0A00 + 0x1000; if ((time & 0xF000) == 0x6000) time = 0x0000; return time; } }

9 September 2014IS1200 Datorteknik, förel 1097 funktionen tick i byte-kod ;Här kommer den metod som kan anropas utifrån. ;vid anrop finns in-parameter i indexerat fält av local variables och med index 1 Method int tick(int) ;time = time + 1; 00x15iload_1;push int from 1(ireg) - time 10x04iconst_1;push #1 20x60iadd;int add: pop-pop-add-push 30x3cistore_1;pop to 1(ireg) - time forts.

9 September 2014IS1200 Datorteknik, förel 1098 funktionen tick i byte-kod forts.;if ((time & 0x000F) == 0x000A) time = time - 0x000A + 0x0010; 4iload_1;push int from 1(ireg) 5bipush 15;push #15 (2-byte-instr) 7iand;int and: pop pop and push 8bipush 10;push #10 10if_cmpne 21;conditional branch 13iload_1;push int from 1(ireg) 14bipush 10;push #10 16isub;int sub: pop pop sub push 17bipush 16;push #16 19iadd;int add: pop pop add push 20istore_1;pop int to 1(reg) 21...

9 September 2014IS1200 Datorteknik, förel 1099 funktionen tick i byte-kod forts.;if ((time & 0x000F) == 0x000A) time = time - 0x000A + 0x0010; 40x15iload_1;push int from 1(ireg) 50x10bipush 15;push #15 (2-byte-instr) 60x0f;value 15=0x0f 70x7eiand;int and: pop pop and push 80x10bipush 10;push #10 90x0a;value 10=0x0a 100xa0if_cmpne 21;conditional branch 110xkl;10 + 0xklmn = 21 maybe 120xmn;address other byte ??? 130x15iload_1;push int from 1(ireg) 140x10bipush 10;push #10 160x64isub;int sub: pop pop sub push 170x10bipush 16;push #16 180x10;value 16=0x10 190x60iadd;int add: pop pop add push 200x3cistore_1;pop int to 1(reg)

9 September 2014IS1200 Datorteknik, förel funktionen tick i byte-kod forts.;if ((time & 0xF000) == 0x6000) time = 0x0000; 61iload_1;push int from 1(ireg) 62ldc #2 ;(2-byte-instr) 64iand;int and: pop pop and push 65sipush 24576;push #24576 (3-byte-instr) 68if_cmpne 73;conditional branch 71iconst_1;push #1 72istore_1;pop int to 1(reg) 73iload_1;returparameter till stack 74ireturn;retur med int på stack

9 September 2014IS1200 Datorteknik, förel Mer om java JVM och byte-code

9 September 2014IS1200 Datorteknik, förel IS1200 Datorteknik allmän kurs Föreläsning 10 Repetition Sammanfattning Lite till

9 September 2014IS1200 Datorteknik, förel G1518 Dator- teknik ak IS1200 Datorteknik Digitala kretsar Data- logi 2G1510 Dator- teknik fk 2G1511 Dator- arkitektur 2G1316 Datorkomm. och datornät 2G1520 Operativ- system 2G1533 Compilers... 2G1915 Concurrent Programming 2B1446 Embedded Systems 2B1463 Embedded Software 2B1448 System-on-Chip Architectures

9 September 2014IS1200 Datorteknik, förel IS1200 Datorteknik Datorns funktion på olika nivåer från JAVA/C-kod till NAND-grind zProgramexempel: sum = 0 ; for (i=1; i<1=7; i=i+1) sum = sum + i; zExempel på digitala komponenter:

9 September 2014IS1200 Datorteknik, förel Hur datorer fungerar Detta har ni lärt er !  Kopplingen mellan  Program i C-kod (pascal, java, …)  Program i Assembler (Nios, MIPS, …)  Maskinkod (binärkod, hexkod)  Exekvering av program i binärkod - i CPU med PIPE-LINE  CPU byggs av logiska kretsar och minnen

9 September 2014IS1200 Datorteknik, förel Hur datorer fungerar Dessutom har ni lärt er !  Cache-minne orsak till införsel funktion, parametrar prestandavinster med cache  Fördelning av processortid görs av OS  Samverkan mellan processer synkronisering, ömsesidig uteslutning

9 September 2014IS1200 Datorteknik, förel Hur datorer fungerar slutligen har ni lärt er ! För Block Data Transfer, BDT gäller att zDMA - Direct Memory Access är bättre än zAvbrottstyrd BDT som är bättre än zProgramstyrd BDT

9 September 2014IS1200 Datorteknik, förel Tentamen innehåller 1.Maskinaritmetik med mera 2.Assemblerprogrammering,subrutiner 3.Assemblerprogrammering pollning/avbrott 4.Cache-minnen 5.Processorkonstruktion 6.CPU scheduling och semaforer

9 September 2014IS1200 Datorteknik, förel IS1200 Datorteknik... nu vet ni... ”Hur datorer fungerar”

9 September 2014IS1200 Datorteknik, förel Välkommen till andra kurser – några exempel yDatorsystemarkitektur yCompilers and Execution Environments yOperating Systems yConcurrent Programming yNetwork Programming with Java yEmbedded Systems ySystem-on-Chip Architectures yEmbedded Software

9 September 2014IS1200 Datorteknik, förel Embedded Systems Embedded systems are an integral part of daily life Embedded systems must meet versatile requirements high performance, low power, safety-critical and low cost Follow-Up Courses: System-on-Chip Architectures Embedded Software Hearing Aid Mobile Phone Airbag Control Course webpage: Contact: Ingo Sander Microcontroller and DSP processor as central components Design for performance and low power Introduction to Real-Time Operating Systems Laboratories supporting the theory

9 September 2014IS1200 Datorteknik, förel Datorsystemarkitektur ● Konsten att få CPUn snabb ● Hårdvara som kör flera instruktioner per klockcykel ● Flera CPUer på ett chipp ● Kompilatorteknik för att utnyttja hårdvaran väl

9 September 2014IS1200 Datorteknik, förel IS1200 Datorteknik Tentamen Mån 14 mars kl KTH Kista: 438, 439, 530, 531, 532, 533, 539, 540, C2, C21, C22, D, E (anmälan via Daisy) LYCKA TILL ! Lördag 28 maj kl Planerade salar, ändringar kan förekomma: L51, L52 vid KTH Valhallavägen !!!