Denna föreläsning zVad kursen handlar om zKursupplägg, litteratur, bra att veta zPrestanda - ämnet för dagen
Kursinnehåll zpipelining zcacheminnen zadressöversättning zprocesser zprestandasiffror
Översikt: pipelining zLöpande bandets princip tid Hämta en instruktion Läs operander Hämta ny instruktion Beräkna resultat Skriv resultat Läs nya operander Beräkna nytt resultat Skriv nytt resultat Hämta en tredje instr. Läs fler operander och så vidare...
Översikt: cacheminnen processorn cacheminnet primärminnet letar först i lilla snabba letar vid behov i stora långsamma
Översikt: adressöversättning process 1 process 2 får inte läsa/skriva varandras minne kan ha delvis samma adresser enligt programkoden x
Översikt: prestandasiffror zMHz = miljoner klockcykler per sekund zMIPS = miljoner instruktioner per sekund zTestprogram: Winstone, Sysmark, SPEC
Kursupplägg zFöreläsningar, övningar, labbar, tenta zLägg tid på labbarna! så blir tentan lätt (nåja…) zTvå övningsgrupper (B22, B23)
Litteratur zKompendier del 1 - extentor, lab-PM, … zVälj: yKompendier del 2 eller yKursbok Patterson & Hennessy: Computer Architecture: A Quantitative Approach
Labbar zLab 1-3 gör du när du vill, redovisa på bokade tider zLab 4 gör du i labbet på bokad tid zLabbet ligger nu bakom STEX
Tenta zEtt tal om cacheminnen, måste klaras yungefär ex-saml del 3 zFlera tal om resten av kursen yungefär resten av ex-saml
Förbättra kursen! zSäj vad ni tycker! E-post zBilda kursnämnd! zUtvärdering mitt i kursen
Prestanda zVad påverkar datorprestanda zHur mäter man datorprestanda zRäkna klockcykler - ett sätt att analysera zAmdahls lag - gräns för förbättringar
Vad påverkar prestanda zCPU zprimärminne zprogram, kompilator zskivminne zdatornät zövriga program, operativsystem
Testprogram verkliga program koncentrat - "kernels" syntetiska testprogram SPEC CPU2000 Winstone NAS kernels LinPack Livermore loops EEMBC Dhrystone
Ur processorns synvinkel zKörtid = icount x CPI x tclk zicount = antal utförda instruktioner zCPI = Cykler Per Instruktion ztclk = 1/klockfrekvensen
Amdahls lag körtid för gamla versionen körtid för nya versionen speedup =
Exempel: flyttalsprocessor utförda instruktioner tid … add.l FADD add.l and.l cmp.l bne FMUL cmp.l beq... andel som ej kan snabbas upp andel som kan snabbas upp
Exempel, forts. andel som ej kan snabbas upp andel som kan snabbas upp total körtid på gamla datorn andel som ej kan snabbas upp andel som snabbats upp total körtid på nya datorn