Presentation laddar. Vänta.

Presentation laddar. Vänta.

William Sandqvist Datakomprimering a) Komprimering för att spara lagringsutrymme. b) Komprimering vid dataöverföring. S Burd, Systems Architecture.

Liknande presentationer


En presentation över ämnet: "William Sandqvist Datakomprimering a) Komprimering för att spara lagringsutrymme. b) Komprimering vid dataöverföring. S Burd, Systems Architecture."— Presentationens avskrift:

1 William Sandqvist william@kth.se Datakomprimering a) Komprimering för att spara lagringsutrymme. b) Komprimering vid dataöverföring. S Burd, Systems Architecture ISBN 0-619-21692-1 Figure 6-15

2 William Sandqvist william@kth.se LZW, algoritmen bakom GIF ZIP PDF Lempel-Ziv-Welch icke förstörande komprimeringsalgoritm. Patentet gick ut 2006 – varsågoda att använda …

3 William Sandqvist william@kth.se Ett exempel Följande exempel har vi hämtat från Wikipedia. Det är ett förvrängt "Hamlet"-citat om 25 bokstäver som effektivt kan komprimeras med LZW- algoritmen. LZW-algoritmen är annars effektivast vid lite längre meddelan- den/filer. To be or not to be or to be or not. Utgångspunkten är att den som komprimerar meddelandet och den som senare ska expandera det är överens om den använda teckentabellen. För att göra exemplet mer lätthanterligt begränsar vi oss till engelska språkets stora bokstäver och utesluter mellanslagen. Tecknet # får betyda meddelandets slut. TOBEORNOTTOBEORTOBEORNOT#

4 William Sandqvist william@kth.se Teckentabellen TOBEORNOTTOBEORTOBEORNOT# En fem bitars kod kan koda 32 tecken och detta räcker således som vår teckentabell eftersom vi bara har har 27 tecken ( engelska alfabetets 26 tecken och # ). 101000111100010001010111110010011100111110100101000111100010001010111110010101000111100010001010 11111001001110011111010000000 Okomprimerad bitsträng – en bitsträng med 25 tecken a´ fem bitar, totalt 25*5=125 bitar. Det är detta bitantal som vi ska försöka minska med hjälp av LZW-algoritmen!

5 William Sandqvist william@kth.se LZW-komprimering (1) Uppdatera lexikon från markören och bakåt med tecken/sträng : Sammansätt meddelandet från markören och framåt med lexikonord: 10100 Ingen uppdater- ing kan ske!

6 William Sandqvist william@kth.se LZW-komprimering (2) Uppdatera lexikon från markören och bakåt med tecken/sträng : Sammansätt meddelandet från markören och framåt med lexikonord: 1010001111

7 William Sandqvist william@kth.se LZW-komprimering (3) Uppdatera lexikon från markören och bakåt med tecken/sträng : Sammansätt meddelandet från markören och framåt med lexikonord: 101000111100010

8 William Sandqvist william@kth.se LZW-komprimering (4) Uppdatera lexikon från markören och bakåt med tecken/sträng : Sammansätt meddelandet från markören och framåt med lexikonord: 10100011110001000101

9 William Sandqvist william@kth.se LZW-komprimering (5) Uppdatera lexikon från markören och bakåt med tecken/sträng : Sammansätt meddelandet från markören och framåt med lexikonord: 1010001111000100010101111

10 William Sandqvist william@kth.se LZW-komprimering (6) Uppdatera lexikon från markören och bakåt med tecken/sträng : Sammansätt meddelandet från markören och framåt med lexikonord: 101000111100010001010111110010 Nästa gång behöver Lexikonet 6 bitars ord! Nästa gång 6 bitars ord!

11 William Sandqvist william@kth.se LZW-komprimering (7) Uppdatera lexikon från markören och bakåt med tecken/sträng : Sammansätt meddelandet från markören och framåt med lexikonord: 101000111100010001010111110010001110 Nu 6 bitars ord i tabellen! Nu 6 bitars ord i meddelandet!

12 William Sandqvist william@kth.se LZW-komprimering (8) Uppdatera lexikon från markören och bakåt med tecken/sträng : Sammansätt meddelandet från markören och framåt med lexikonord: 101000111100010001010111110010001110001111

13 William Sandqvist william@kth.se LZW-komprimering (9) Uppdatera lexikon från markören och bakåt med tecken/sträng : Sammansätt meddelandet från markören och framåt med lexikonord: 101000111100010001010111110010001110001111010100

14 William Sandqvist william@kth.se LZW-komprimering (10) Uppdatera lexikon från markören och bakåt med tecken/sträng : Sammansätt meddelandet från markören och framåt med lexikonord: 101000111100010001010111110010001110001111010100011011 Nu får vi nytta av ett lexikon-ord!

15 William Sandqvist william@kth.se LZW-komprimering (11) Uppdatera lexikon från markören och bakåt med tecken/sträng : Sammansätt meddelandet från markören och framåt med lexikonord: 101000111100010001010111110010001110001111010100011011011101

16 William Sandqvist william@kth.se LZW-komprimering (12) Uppdatera lexikon från markören och bakåt med tecken/sträng : Sammansätt meddelandet från markören och framåt med lexikonord: 101000111100010001010111110010001110001111010100011011011101011111

17 William Sandqvist william@kth.se LZW-komprimering (13) Uppdatera lexikon från markören och bakåt med tecken/sträng : Sammansätt meddelandet från markören och framåt med lexikonord: 101000111100010001010111110010001110001111010100011011011101011111100100

18 William Sandqvist william@kth.se LZW-komprimering (14) Uppdatera lexikon från markören och bakåt med tecken/sträng : Sammansätt meddelandet från markören och framåt med lexikonord: 101000111100010001010111110010001110001111010100011011011101011111100100011110

19 William Sandqvist william@kth.se LZW-komprimering (15) Uppdatera lexikon från markören och bakåt med tecken/sträng : Sammansätt meddelandet från markören och framåt med lexikonord: 101000111100010001010111110010001110001111010100011011011101011111100100011110100000

20 William Sandqvist william@kth.se LZW-komprimering (16) Uppdatera lexikon från markören och bakåt med tecken/sträng : Sammansätt meddelandet från markören och framåt med lexikonord: 101000111100010001010111110010001110001111010100011011011101011111100100011110100000100010

21 William Sandqvist william@kth.se LZW-komprimering (17) Vi har nu nått slutet av meddelandet (slut-tecknet #). Bitföljden blev 96 tecken lång. Jämför med den ursprungliga bitföljden med 125 bitar! 101000111100010001010111110010001110001111010100011011011101011111100100011110100000100010000000 101000111100010001010111110010011100111110100101000111100010001010111110010101000111100010001010 11111001001110011111010000000 96/125 = 0,76. Meddelandet har komprimerats med 25%. Längre texter kan reduceras med c:a 50%.

22 William Sandqvist william@kth.se LZW-dekomprimering (1) Det räcker med att den som ska dekomprimera, ”packa upp”, med- delandet känner den ursprungliga teckentabellen, därefter kan lexikonet konstrueras i takt med att tecknen mottages. 10100 Mottaget tecken: Dekomprimerat meddelande: T Lexikon kan inte uppdateras nu.

23 William Sandqvist william@kth.se LZW-dekomprimering (2) Mottagna tecken: Uppdaterat lexikon: Dekomprimerat meddelande: TOTO 1010001111

24 William Sandqvist william@kth.se LZW-dekomprimering (3) Mottagna tecken: 101000111100010 Dekomprimerat meddelande: TOB Uppdaterat lexikon:

25 William Sandqvist william@kth.se LZW-dekomprimering (4) Mottagna tecken: 10100011110001000101 Dekomprimerat meddelande: TOBE Uppdaterat lexikon:

26 William Sandqvist william@kth.se LZW-dekomprimering (5) Mottagna tecken: 1010001111000100010101111 Dekomprimerat meddelande: TOBEO Uppdaterat lexikon:

27 William Sandqvist william@kth.se LZW-dekomprimering (6) Mottagna tecken: 101000111100010001010111110010 Dekomprimerat meddelande: TOBEOR Uppdaterat lexikon: Nästa gång behöver Lexikonet 6 bitars ord! Nästa gång 6 bitars ord!

28 William Sandqvist william@kth.se LZW-dekomprimering (7) Mottagna tecken: 101000111100010001010111110010001110 Dekomprimerat meddelande: TOBEORN Uppdaterat lexikon: Från och med nu 6 bitars ord! Nu 6 bitars ord!

29 William Sandqvist william@kth.se LZW-dekomprimering (8) Mottagna tecken: 101000111100010001010111110010001110001111 Dekomprimerat meddelande: TOBEORNO Uppdaterat lexikon:

30 William Sandqvist william@kth.se LZW-dekomprimering (9) Mottagna tecken: 101000111100010001010111110010001110001111010100 Dekomprimerat meddelande: TOBEORNOT Uppdaterat lexikon:

31 William Sandqvist william@kth.se LZW-dekomprimering (10) Mottagna tecken: 101000111100010001010111110010001110001111010100011011 Dekomprimerat meddelande: TOBEORNOTTO Uppdaterat lexikon:

32 William Sandqvist william@kth.se LZW-dekomprimering (11) Mottagna tecken: 101000111100010001010111110010001110001111010100011011011101 Dekomprimerat meddelande: TOBEORNOTTOBE Uppdaterat lexikon:

33 William Sandqvist william@kth.se LZW-dekomprimering (12) Mottagna tecken: 101000111100010001010111110010001110001111010100011011011101011111 Dekomprimerat meddelande: TOBEORNOTTOBEOR Uppdaterat lexikon:

34 William Sandqvist william@kth.se LZW-dekomprimering (13) Mottagna tecken: 101000111100010001010111110010001110001111010100011011011101011111100100 Dekomprimerat meddelande: TOBEORNOTTOBEORTOB Uppdaterat lexikon:

35 William Sandqvist william@kth.se LZW-dekomprimering (14) Mottagna tecken: 101000111100010001010111110010001110001111010100011011011101011111100100011110 Dekomprimerat meddelande: TOBEORNOTTOBEORTOBEO Uppdaterat lexikon:

36 William Sandqvist william@kth.se LZW-dekomprimering (15) Mottagna tecken: 101000111100010001010111110010001110001111010100011011011101011111100100011110100000 Dekomprimerat meddelande: TOBEORNOTTOBEORTOBEORN Uppdaterat lexikon:

37 William Sandqvist william@kth.se LZW-dekomprimering (16) Mottagna tecken: 101000111100010001010111110010001110001111010100011011011101011111100100011110100000100010 Dekomprimerat meddelande: TOBEORNOTTOBEORTOBEORNOT Uppdaterat lexikon:

38 William Sandqvist william@kth.se LZW-dekomprimering (17) Mottagna tecken: 101000111100010001010111110010001110001111010100011011011101011111100100011110100000100010000000 Dekomprimerat meddelande: TOBEORNOTTOBEORTOBEORNOT# Klart! Meddelandet dekomprimerat. Lexikon kan raderas.

39 William Sandqvist william@kth.se LZW-dekomprimering Går det alltid bra att dekomprimera meddelanden? Vad händer om det vid komprimeringen går att uppdatera tabellen med en sträng som också kan sändas direkt? Hur ska mottagaren göra om det kommer en kod som inte kan hittas i tabellen? Detta kan bara gälla om meddelandet innehåller ”cScSc” (c ett tecken, S en sträng) och då cS finns i lexikon. Först skickas cS och lexikon uppdateras med cSc. Därefter skickas cSc som inte finns i det mottagande lexikonet. Men eftersom cS finns, och det okända tecknet måste vara av typen cSc (börja och sluta på samma) så kompletterar mottagaren sitt lexikon.

40 William Sandqvist william@kth.se Förstörande komprimering av ljud MP3

41 William Sandqvist william@kth.se Psykoakustik Förstörande komprimering utnyttjar och använder de defekter som finns i människans uppfattningsförmåga. Exempelvis har studier i psykoakustik visat att personer endast kan uppfatta ett fåtal av de starkaste tonerna i ett ljud. Det gör att man kan ta bort de svagare ljuden med signalbehandling och erhålla en signal som inte har lika stora amplitud- och frekvensvariationer. Detta görs med en enhet som kallas för Perceptual modeler. Signalen blir därmed lättare att komprimera på ett konventionellt sätt, dvs med någon algoritm liknande LZW. Efter en sådan behandling kan ljudet komprimeras till ca en tiondel av den ursprungliga storleken, utan att lyssnaren uppfattar distorsionen. Denna metod använder MP3-standarden.

42 William Sandqvist william@kth.se ex 32 frekvensband Enheten Frequency separator delar upp ljudet i frekvensband på samma sätt som equalizern i din hemmastereo.

43 William Sandqvist william@kth.se MP3 Enheten Data encoder sammansätter informationen om ljudets styrka i olika frekvensband, med de psykoakustiska reglerna om vad örat kan uppfatta. Frekvenser som ändå inte skulle kunna uppfattas tas bort. Därefter komprimeras datamängden med en ”icke förstörande” algoritm liknande LZW. (Det är inte troligt att en varelse från en annan planet skulle hålla med om att MP3-ljudet är ”samma” som orginaljudet, eftersom metoden bygger på psykoakustiska regler för just vårt öra.)

44 Bildkompression William Sandqvist william@kth.se GIF Använder en ”färgpalett” med 256 färger – verklighetens bilder har fler färger, det är därför bara datorgenererade bilder, som använder paletten, som återges förlustfritt. Bildfilen komprimeras med LZW-algoritmen (förlustfritt). JPEG använder ”millioner färger”, komprimeringen styrs av ett ”kvalitetstal” – man får kompromissa mellan återgivningsfel och filstorlek.

45 (ASCII-grafik) William Sandqvist william@kth.se Bilden till höger är ”ritad” med vanliga bokstäver (55 rader a’ 100 tecken). Det är således uppenbart att man kan reducera en bildfils storlek om man är beredd att ge avkall på bildkvalitén.

46 William Sandqvist william@kth.se JPEG Bildkomprimering Hög kompression Låg kompression Små 8  8 pixel bildblock ”transformeras”, dvs. omräknas, matematiskt (DCT), och förlustfritt. Därefter begränsas värdena (Quantization) efter hur stor förlust man kan tåla. För att presentera bilden förfar man i omvänd ordning. De värden bildpunkterna haft innan begränsningen kan inte återskapas fullständigt. Detta ger återgivningsfel.

47 William Sandqvist william@kth.se 3:115:1 150:1 50:1 Källa: Wikipedia


Ladda ner ppt "William Sandqvist Datakomprimering a) Komprimering för att spara lagringsutrymme. b) Komprimering vid dataöverföring. S Burd, Systems Architecture."

Liknande presentationer


Google-annonser