Denna föreläsning zVad kursen handlar om zKursupplägg, litteratur, bra att veta zPrestanda - ämnet för dagen
Kursinnehåll zpipelining zcacheminnen zadressöversättning zprocesser zprestandasiffror
Översikt: pipelining zLöpande bandets princip tid Hämta en instruktion Läs operander Hämta ny instruktion Beräkna resultat Skriv resultat Läs nya operander Beräkna nytt resultat Skriv nytt resultat Hämta en tredje instr. Läs fler operander och så vidare...
Översikt: cacheminnen processorn cacheminnet primärminnet letar först i det lilla snabba letar vid behov i det stora långsamma
Översikt: adressöversättning process 1 process 2 får inte läsa/skriva varandras minne kan ha delvis samma adresser enligt programkoden x
Översikt: prestandasiffror zMHz = miljoner klockcykler per sekund zMIPS = miljoner instruktioner per sekund zTestprogram: Winstone, Sysmark, SPEC
Kursupplägg zFöreläsningar, övningar, labbar, tenta zLägg tid på labbarna! så blir tentan lätt (nåja…) zEn övningsgrupp Salsändring onsdag 4 september: L52
Litteratur zKompendier som säljs av institutionen zVill du veta mer, läs gärna: Patterson & Hennessy: Computer Architecture: A Quantitative Approach zhttp://
Labbar zLab 1-2 gör du när du vill, redovisa på bokade tider zInfo om lab 3 kommer senare zLab 4 gör du i labbet på bokad tid zLabbet ligger bakom STEX (LQ306)
Tenta zEtt tal om cacheminnen, måste klaras yungefär ex-saml del 3 zFlera tal om resten av kursen yungefär resten av ex-saml
Förbättra kursen! zSäj vad ni tycker! E-post zBilda kursnämnd! zUtvärdering mitt i kursen
Prestanda zVad påverkar datorprestanda zHur mäter man datorprestanda zRäkna klockcykler - ett sätt att analysera zAmdahls lag - gräns för förbättringar
Vad påverkar prestanda zCPU zprimärminne zprogram, kompilator zskivminne zdatornät zövriga program, operativsystem
Testprogram verkliga program koncentrat - "kernels" syntetiska testprogram SPEC CPU2000 Winstone NAS kernels LinPack Livermore loops EEMBC Dhrystone
Ur processorns synvinkel zKörtid = icount x CPI x tclk zicount = antal utförda instruktioner zCPI = Cykler Per Instruktion ztclk = 1/klockfrekvensen
Längre pipeline = högre CPI zHopp medför att pipelinen töms zLång pipeline klarar högre klockfrekvens Pentium: 5 steg PPro/II/iii: 10 steg P4: 20 steg
Teoretiska CPI-beräkningar zCPI och andel av utförda instruktioner zExempel: yALU-op: CPI = 1, andel 40% yLoad, Store: CPI = 2, andel = 36% yHopp: CPI = 2, andel = 24% yCPI medel = 1 x 0,4 + 2 x 0, x 0,24 = 1,6
Amdahls lag körtid för gamla versionen körtid för nya versionen speedup =
Exempel: flyttalsprocessor utförda instruktioner tid … add.l FADD add.l and.l cmp.l bne FMUL cmp.l beq... andel som ej kan snabbas upp andel som kan snabbas upp
Exempel, forts. andel som ej kan snabbas upp andel som kan snabbas upp total körtid på gamla datorn andel som ej kan snabbas upp andel som snabbats upp total körtid på nya datorn