Torbjörn Wiberg Umeå universitet

Slides:



Advertisements
Liknande presentationer
Multimedie- och kommunikationssystem, lektion 4
Advertisements

1 A F A S I G N A L Datorhjälp vid kommunikationshinder Peter Kitzing, LU, V 2002.
Beskriver vad eleven ska försöka uppnå
Talföljder formler och summor
Formulär Tänkte nu gå igenom vad ett formulär är och hur man kan skapa dem i Access.
Hastighetens påverkan på koldioxidutsläppen
Vattenkemiska data Workshop, maj 2014 Claudia von Brömssen, SLU.
Lagringsmedia.
Klasser och objekt.
Funktionen SA10-Grupper. Följande typer av grupper finns: - Grupp i kurs hör alltid ihop med en kurskod - Grupp i program hör alltid ihop med en programkod.
Arbeta med bilder Bengt Kjöllerström Att bearbeta bilder och lägga in dem i Disgen Bengt Kjöllerström.
Ljud.
VIDEOPRODUKTIONSTEKNIK PRODUKTIONS PLANERING Skapar ett skriftligt dokument som innehåller ALLT som kan komma till nytta. Alla berörda får ett ex. ALLT.
ZIP-formatet Av Viktor Ekholm.
Resonans, eko, ultraljud, infraljud, ljudets hastighet
Datakomprimering a) Komprimering för att spara lagringsutrymme.
Spektrala Transformer för Media
Introduktion till IT och e-Tjänster Delkurs 3 1 Datorer i Nätverk En introduktion till ’Hård Infrastruktur’ DEL 2.
Bråktal Av: Kawa Ali Matte och NO lärare Örtagårdskolan Vt: 10
Metodmöte den 8 juni 2007 Definitioner TSV Pirjo Svedberg MMS.
Silberschatz, Galvin and Gagne ©2009 Operating System Concepts – 8 th Edition, Kapitel 11: Implementation av filsystem.
INFÖR NATIONELLA PROVET
Föreläsning 11 Arrayer.
Ljud.
Mobil Uppföljningsapplikation
Från binära till hexadecimala
PIRATPARTIET Rubriksnitt: Impact, vanlig text Arial Här kan man lägga en lite ingressbetonad text på ett par tre meningar (men funkar även utan). Vill.
Bakgrund! Piteå kommun skall lägga om strukturen i det befintliga nätverket. Det kommer att gå från tre system som löper paralellt med varandra till ett.
Fotografera mera! fotograferamera1.ppt.
Vektorer (klassen Vector) Sortering
Beräkna en ekvation (metod 1)
Tillämpad statistik Naprapathögskolan
Nyårsafton Ett fotoreportage av Daniel Fasth
Beräkna en ekvation (metod 1)
Matematiken bakom musiken
Kommentarer F5 BE1 Några nyttiga exempel: Hur ser en enstaka puls ut i frekvensplanet? Pulsen är tidskontinuerlig och icke-periodisk, dvs vi använder FOURIER-transform.
TÄNK PÅ ETT HELTAL MELLAN 1-50
Energi Älvkarleby Ridklubb
Utbildning ICF som redskap vid samverkan
Student Ekonomi Erik Nygårds Hang-Jin Lee Vina Balaghi Projektarbete 2 732G22 Grunder i statistisk metodik Ht-08.
Ljus - optik.
STs arbetsmiljörapport i samarbete med SCB Seminarium Torbjörn Carlsson.
Distribuerade realtidssystem Dr Peter Parnes
1 Föreläsning 6 Programmeringsteknik och Matlab 2D1312/2D1305 Metoder & parametrar Array API och klassen ArrayList.
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
INT 3 F4 Medieteknik Del2 Komprimering, ljud och rörliga bilder DSV Peter Mozelius.
Hörseln.
Föreläsning 5 Arrayer & ArrayList Hur man använder API:n
© Björn Hedin, NADA/KTH Media, Multimedia och videokodning 2D1518 Audio-, Video och Multimediaproduktion
Datornätverk A – lektion 4 Fortsättning: Kapitel 4: Datatransmission. Kapitel 5: Modulation.
Akustik Läran om ljud.
Talperception 2 Något lite om psykoakustik Psykoakustik Psykoakustiken är en gren av psykofysiken. Det låter kanske konstigt och svårt, men är egentligen.
Föreläsning 1: Bild- och ljudkodning
F1-be-03_PS1 Telekommunikation F1. F1-be-03_PS2 INFORMATION KODNING MODULATION KANALEN tid frekvens.
Spektrala Transformer
Målsättning Målsättning.
Vägda medeltal och standardvägning Index
Föreläsning 7 Fysikexperiment 5p Poissonfördelningen Poissonfördelningen är en sannolikhetsfördelning för diskreta variabler som är mycket.
Inspelning och digitalisering
Kursplanering och kursmaterial
Det som man kan koppla till datorn. (periferienheter)
Repetition of some basic concepts. PCM = Pulse Code Modulation = Digital transmission of analogue signals Sampler AD-converter with seerial output
Digitalitet.
Förskoleenkät Föräldrar 2012 Förskoleenkät – Föräldrar Enhet:Hattmakarns förskola.
Vad är Leorvision? Vi tar kundens reklamfilm ut i stadsmiljön med bibehållen kvalitet Möt kunderna med reklambudskapet där de tar sina köpbeslut Fungerar.
Konditon Upplevelsen av ett motionspass påverkas vilken intensitet träningen har. Man kan dela upp konditionsträning i två delar: Högintensiv träning och.
Förra föreläsningen: Historisk utveckling av elektromagnetismen Vektorer Koordinatsystem.
MTFD Vårmöte 2016 Umeå – Tips & Tricks MTFD Presentationsmall: tips & tricks Introduktionsbild: (Denna bild tas bort) Denna Mall är framtagen för att underlätta.
Multimedie- och kommunikationssystem, lektion Forts. Kap 2: Signaler och Kvalitetsmått Kap 3-4: Ljud- och videokompression.
Grundläggande signalbehandling
Presentationens avskrift:

Torbjörn Wiberg Umeå universitet Komprimering Torbjörn Wiberg Umeå universitet 20002-02-06 Torbjörn Wiberg, UmU

Disposition Inledning Två typer av komprimering Komprimeringsmetoder Inför val av metod Ljudkomprimering Bildkomprimering Film- och animeringskomprimering 20002-02-06 Torbjörn Wiberg, UmU

Inledning Komprimering - en förutsättning för multimedier Några mått: vare sig de är interaktiva, distribuerade eller inte Några mått: 1 CD rymmer 648 MB. Ljud (stereo, "CD"-kvalitet) - 72 minuter per CD. Film (studiokvalitet) - 30 sek per CD En småbildsfilm - ca 50MB, dvs 13 per CD. 1 DVD rymmer x GB En långfilm på TV (90 minuter) behöver 120 GB, dvs x0 DVD. Allt detta okomprimerat 20002-02-06 Torbjörn Wiberg, UmU

Komprimering – med eller utan informationsförlust Kan man acceptera informationsförlust? Sampling, analog återgenerering genom förstärkning och t.ex. kopiering ger informationsförlust. Det är inte orimligt att medge förlust vid lagring också. Komprimering med förlust kan acceperas i de flesta fall när man komprimerar ljud och bild. Upp till en viss kompressionsgrad, uppfattar vi inte ens att sådan teknik använts. Var går den gränsen? Det beror på applikationen i sig och dess andra kvalitetsegenskaper. Komprimering är en form av kodning. Fluckiger använder ordet kodning - Förlust vid kodning beroende på samplingsfrekvens, djup och komprimering. 20002-02-06 Torbjörn Wiberg, UmU

Två typer av komprimering Bit-komprimering (entropy encoding) Oberoende av vad som komprimeras. Förlustfri. Två typer Kodning av upprepningar och komprimering baserad på vanliga(st) förekommande mönster (statistisk komprimering/kodning/huffmankodning). Innehållskomprimering (source encoding). Kunskap om typ och struktur på informationen utnyttjas. Med eller utan försluster. Förhoppningen är att kunskap om innehållet ska ge högre komprimeringseffekter. Tre typer Transformkodning (t.ex Fourier transformering) Differenskodning (av t.ex bildsekvenser) Vektorkodning (kod för ett block av information). Ofta bitkomprimeras ett innehållskomprimerat material. 20002-02-06 Torbjörn Wiberg, UmU

Komprimeringsmetoder Komprimeringsmetoder baseras på ett fåtal grundidéer som specialutformas för den tillämpning man har i åtanke nästas på heuristiska grunder Grundidéerna är Upprepningskomprimering Statistisk komprimering Transformkodning Differenskodning Vektorkodning Det här är delvis mina egna, beskrivande namn på idéerna, de specifika metoderna kan ha ganska fantasifulla namn 20002-02-06 Torbjörn Wiberg, UmU

Upprepningskomprimering Interaktiva distribuerade multimedier 2000-11-29 Upprepningskomprimering Principen är att man söker efter upprepning av enstaka bitar tecken (oktetter) eller andra mönster Man kodar dessa som antal-kod Det måste vara ett visst antal upprepningar (>~4) för att det ska löna sig. Kanske så här YXXXXZ ----> Y"4"XZ Där " är reserverad, dvs " kodas som "". Värddatorerna innehåller resurserna och kommunikationsdatorerna sköter kommunikationen, förmedlar meddelanden/paket 20002-02-06 Torbjörn Wiberg, UmU Torbjörn Wiberg, UmU

Statistisk komprimering Interaktiva distribuerade multimedier 2000-11-29 Statistisk komprimering Jfr Morse-kod e = *, i = * *, t = -, m = - - , q = - - * - Vanliga mönster ges korta koder. Man måste ha statistik på vad som är vanliga mönster i en viss typ av data. Fast kodbok (Morse) som är välbekant eller Både kodbok och data lagras (Dynamisk Huffman-kodning). Kodboken kan räknas om för delar av materialet - en bild eller en sekvens av bilder Exempel: universitetets blå-vita logo behöver bara två koder - blått och vitt. Kodboken talar om vilken färg som svarar mot 0 respektive 1 Värddatorerna innehåller resurserna och kommunikationsdatorerna sköter kommunikationen, förmedlar meddelanden/paket 20002-02-06 Torbjörn Wiberg, UmU Torbjörn Wiberg, UmU

Transformkodning Tids- och/eller rumstransformation till ett rum som är mer lämpat för (t.ex statistisk) kodning. Fourier-transform - till frekvensrummet. Begränsar variationshastigheten i materialet Tar bort höga frekvenser. Ger en mer utslätad bild. Koden anger amplituden (styrkan) för de lägsta frekvenserna. Välj även djupet (upplösningen, antalet bitar) i koden och skalan (t.ex linjär eller logaritmisk) av amplituden. Två förlustkällor frekvensbegränsning amplituddjup Diskret cosinustransform används ofta för bilder. DCT 20002-02-06 Torbjörn Wiberg, UmU

Differenskodning Koda ett värde enstaka värde eller t,ex en rad i en bild (fax) eller en ruta i en bild. Ange nästa värde som en differens från detta värde. Differensen kräver ofta färre bitar än det fullt kodade värdet. Både ljud och bildsekvenser passar för denna form klipp medför behov av full omkodning Komprimeringen sker dels genom ansatsen i sig genom att välja djup i differenskoden. Man kan också göra trendanalyser och koda avvikelser från trenden i stället för avvikelser från värdet i sig. 20002-02-06 Torbjörn Wiberg, UmU

Vektorkodning Bitsekvensen delas in i vektorer (eller mer generella arrayer). I stället för vektorn själv sänds ett index som anger vilken av en tabell av vektorer som matchar vektorn (bäst). En bild delas in i block av pixlar. Bygger också på att man har en Huffman-kod-tabell för blocken. Fraktalkodning ett exempel. Nästade block av roterade, speglade, förskjutna mönster. Tar extra lång tid att genomföra komprimeringen. Kod-tabellen blir uppenbar för mottagaren först när den används för förfining av bilden. Hur sätter man upp kod-tabellen? Hur matchar man data mot tabellen? Nyaste formen av komprimerig. Stora förhoppningar på kompressionseffekt. 1:1000, ifrågasätts av Fluckiger. 20002-02-06 Torbjörn Wiberg, UmU

Inför val av metod Det är mer arbete att komprimera än att dekomprimera. Parametrar för interaktiva distribuerade multimedier dekomprimeringen ska ske i realtid har kommunikationskanalen hög eller låg kapacitet ska komprimeringen ske i realtid eller ej Vektorkodning går snabbt att packa upp t.ex Texturer som mappas direkt till bilden. Eftersändningar Tjänar på att lägga jobb på att uppnå stor komprimeringseffekt. Interaktiva sändningar komprimering medför fördrljning har inte tid att komprimera så mycket. 20002-02-06 Torbjörn Wiberg, UmU

Ljudkomprimering Somliga metoder passar bättre för ljud och andra för bild. Det finns en del standardiserat kring komprimering och kodning ITU – Internationella teleunionen Ljudkvalitet Telefon 200 - 3000 Hz Tal 50 - 10 000 Hz. FM radio 20 - 15000 Hz Hörbart 15 - 20000 Hz 20002-02-06 Torbjörn Wiberg, UmU

Grundkodning av ljud Puls-kodning Samplingsfrekvens Telefoni Varje sampel kodas för sig Linjär eller logaritmisk kodning. Linjär ev med basvärde (som kodas med t.ex 100). Logaritmisk vanligast för telefoni. Samplingsfrekvens För att representera en analog signal av frekvens f krävs sampling i 2f - Nyquists teorem. Telefoni 3.5KHz ljudspektrum. Standard G.711 - var 125us (8kHz). Amplituddjup G.711 8 bitar. Dvs 8KHz * 8 bitar = 64Kbps 20002-02-06 Torbjörn Wiberg, UmU

Komprimering av grundkoden Differenskodning av 64kbps info 4 bitars differenskoddjup 64kbps  32kbps G.722 Mål: bättre ljudkvalitet. Differenskodning applicerad på en kanal delad i två band. 16KHz sampling 14 bitars amplituddjup på 64Kbps. G.723 Som G.72x men på 24Kbps. Dvs lägre ljudkvalitet som resultat. (Används knappast) 20002-02-06 Torbjörn Wiberg, UmU

Komprimering av grundkoden, forts Fokus på låg kom.kapacitet 16Kbps, 3.4KHz ljud. Vektorkomprimering, baserad på linjär trendprognos (CELP). GSM 13.2 Kbps, 8KHz sampling sämre kvalitet än 711. CELP - 1016. Telefonkkanal komprimeras till 4.8Kbps differenskodning av vektorer med fast kodbok. Kvalitet som G.721 där 64kbps komprimerats till 32kbps. Komprimeringsfaktor för telefonikanal 1:13. 20002-02-06 Torbjörn Wiberg, UmU

Komprimering av grundkoden, fforts För högre kvalitet används MPEG-ljudkomprimeringsstandarder. MPEG - Moving Pictures Expert Group. En familj av standarder. Tre standardiseringsnivåer Lager 1,2 o 3. MPEG-layer 3 mest avancerade komprimeringen. Tekniken baseras på FFT av 32 ljud-subkanaler, med brusanalyser. Avsedda att användas på mono-kanaler mellan 32 till 448Kbps. Sampling 32, 44.1 eller 48 KHz. MPEG-layer3 komprimering till nästan CD-kvalitet på 64Kbps-kanal för mono. Kom ihåg – en 64 kbps-kanal behövs enligt Nyquists teorem (samplingfrekvensen 2f, f är frekvensomfånget som ska kodas) behövs för kodnng av telefoni med 8 bitars amplituddjup. 20002-02-06 Torbjörn Wiberg, UmU

Komprimering av bilder JPEG - Joint Potographic Expert Group. ISO-standard i samarbete med ITU. GIF – Graphical Interchange Format Ursprungligt fokus på import/export till program 20002-02-06 Torbjörn Wiberg, UmU

JPEG För fotografiska bilder Använder GIF för grafik Använder DCT (discrete cosine transform), djupkodning upprepningskomprimering, Huffman-kodning. Kan ställas in för olika typer och grader av komprimeringsförlust ( I kontrast till Fax-standarder t.ex. avser tvåtons-komprimering (två färger/toner - vit och svart)) 20002-02-06 Torbjörn Wiberg, UmU

JPEG - forts JPEG stöder fyra sorters komprimering: Arbetsstegen: Sekvensiell - ett svep. Ger informationsförlust. Progressiv - flera svep, kornigheten i kodningen minskas successivt vid dekomprimeringen. Ger informationsförluster. Förlustfri kodning. Hierarkisk kodning. Upplösningsnivåer. Arbetsstegen: Prep av datablocken Innehållskomprimering (DCT, och djupkodning) Bitkomprimering 20002-02-06 Torbjörn Wiberg, UmU

Komponenter i representation av bilder Det finns olika sätt att ange komponenter i en bildpunkt Luminans - ögats sammanlagda reaktion på ljus (bildpunkt). Lightness - svart-vit Brightness - ljus eller mörk En färg är en upplevelse som kan skapas av spektralt olika sammansatta ljusvågor. Varje färg "kan åstadkommas" med en lämpling blandning av tre olika färger (både + och --blandning). En videokamera fångar kontinuerligt intensiteten i den röda, blå och gröna färgkomponenten i ljuset. RGB-signalen kan transformeras till tre andra signaler - en luminanssignal Y (lightness och brightness) och två färgsignaler. 20002-02-06 Torbjörn Wiberg, UmU

Komprimering av bildkomponenter Vi är mindre känsliga för färg än luminans. Det betyder att färgsignalen kan samplas med lägre upplösning än luminansen för att ge en bild en given upplevd kvalitet. Färgsignalerna fås genom att subtrahera luminanssignalen från två av RGBsignalerna. Hur detta görs är en viktig skillnad mellan NTSC och PAL. Skillnaderna mellan samplingsfrekvenserna för Y och färgsignalerna varierar i olika sammanhang Studiokvalitets-TV - 4:2:2 (4+2+2 = 0,67*(4+4+4)). Videokonferens 4:1:1 (4+1+1=0,5*(4+4+4)) - standard H.261. Standarder finns. Vanligt med halva antalet färgdifferenspunkter per rad halva antalet rader per ”bildruta” Dvs med en reduktion av kom-behovet med 50% 20002-02-06 Torbjörn Wiberg, UmU

JPEG - preparering av datablocken Varje bild utgörs av en matris av amplitudvärden för bildkomponenterna Matrisdimensionerna varierar beroende på samplingsfrekvenserna för de respektive komponenterna. 4:1:1 ger en matris med en fjärdedel av elementen för färgkomponenterna. Matriserna blockindelas i 8*8-block. 20002-02-06 Torbjörn Wiberg, UmU

JPEG – DCT DCT är en två-dimensionell transform som tar 8*8 block med samplade värden och ger 8*8 block med värden som anger förekomster av frekvenskomponenter i de två dimensionerna. 0,0-värdet ger medelamplituden (0-frekvensen). Dessa matriser kan komprimeras med sedvanlig teknik. Valet av metod påverkar den upplevda bildkvaliteten Vi är mest känsliga för medelsnabba förändringar i bilden. Det är alltså inte nödvädigt att återge skarpa kanter exakt. 20002-02-06 Torbjörn Wiberg, UmU

JPEG – djupkodning och komprimering Kodningen av djupinformationen i frekvensrummet är viktig. Höga och låga frekvenser kan komprimeras kraftigare än medelfrekvenser. När kodningen av djupinformationen skett: Mellan blocken komprimeras sekvenser av 0-frekvensvärden med DPCM (Differential Pulse Code Modulation). Inom ett block sker upprepningskomprimering av diagonalnumrerade värden i blocket. Till sist sker så statistisk komprimering (Huffman). JPEG komprimerar en faktor 20-25 (kan upplevas ha god kvalitet av det mänskliga ögat). Förlustfri ofta en faktor 2. 20002-02-06 Torbjörn Wiberg, UmU

Film- och animeringskomprimering Differenskodning mellan bilder i en sekvens. Går ej in på detta. MPEG-2 studiokvalitet-TV, multipla CD-kvalitets-ljudkanaler. 4 - 6Mbps. MPEG-4 Videokonferens vid medium-upplösning och låg hastighet 20002-02-06 Torbjörn Wiberg, UmU

Interaktiva distribuerade multimedier 2000-11-29 Kommunikationsbehov Bilder och ljud komprimeras, det introducerar en fördröjning Uppskattat kommunikationsbehov Videokonferenskvalitet - 0.1 Mbps VCR-kvalitet - 1.2 Mbps Broadcast-kvalitet - 2-4 Mbps Studio-kvalitet - 3-6 Mbps (okomprimerat 166Mbps) HDTV-kvalitet - 25 - 34 Mbps (okomprimerat 2000Mbps) Fotografisk kvalitet 20002-02-06 Torbjörn Wiberg, UmU Torbjörn Wiberg, UmU