Föreläsning 1: Bild- och ljudkodning

Slides:



Advertisements
Liknande presentationer
Multimedie- och kommunikationssystem, lektion 4
Advertisements

Anders Fransén, Produktchef. Videostorlek SD 720 x 576 0,4 Mpixel.
Multimedia, möjligheter och begränsningar.
WORKSHOP MED IPAD OCH APPAR
• 10 x Digital Zoom • Möjlighet till rörlig bild från 4 kameror samtidigt och upp till 12 st. på en skärmbild • Rörelsesensor • pixlar • Färgvisning.
hej och välkomna EKVATIONER Ta reda på det okända talet.
Vilmaseminarium November 2012
Bildkodning och datakompression Föreläsning 11
Snabbare kommunikation
Arbetare Sjukförsäkring AGS AGS.
Kandidatuppsats VT14 Kursledare: Lotta Hallberg och Karl Wahlin
Multimedie- och kommunikationssystem, lektion 7
VIDEOPRODUKTIONSTEKNIK PRODUKTIONS PLANERING Skapar ett skriftligt dokument som innehåller ALLT som kan komma till nytta. Alla berörda får ett ex. ALLT.
ZIP-formatet Av Viktor Ekholm.
Datakomprimering a) Komprimering för att spara lagringsutrymme.
23 August 2014 IS1200 Datorteknik vt09, föreläsning 10, (E och I mfl)1 IS1200 Datorteknik Föreläsning Processorkonstruktion 2. DMA, Direct Memory.
Programmeringsteknik K och Media
FL2 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
Introduktion till IT och e-Tjänster Delkurs 3 1 Datorer i Nätverk En introduktion till ’Hård Infrastruktur’ DEL 2.
IS1500 Datorteknik och komponenter
Torbjörn Wiberg Umeå universitet
Bastugatan 2. Box S Stockholm. Blad 1 Läsarundersökning Maskinentreprenören 2007.
Perspektivplan 2025 DISPOSITION Energi- och klimatpolitiken
INFÖR NATIONELLA PROVET
Schedule F6: Segmentation and Clustering F7: Multispectral Images (Sune Svanberg) F8: Segmentation and Fitting F9: Segmentation, Recognition and Classification.
Beräkna en ekvation (metod 1)
Föreläsning 2: Grundläggande informationsteori
Från Gotland på kvällen (tågtider enligt 2007) 18:28 19:03 19:41 19:32 20:32 20:53 21:19 18:30 20:32 19:06 19:54 19:58 20:22 19:01 21:40 20:44 23:37 20:11.
Känslighet MDS och NF Dynamiskt område DR och BDR
Matematiken bakom musiken
Analogt och Digitalt.
TÄNK PÅ ETT HELTAL MELLAN 1-50
1 Föreläsning 7 Repetition Instansvariabler och klassvariabler Klassmetoder och Instansmetoder.
Abelli, B. (2004). Programmeringens Grunder – med exempel i C#. Lund: Studentlitteratur 1 De bifogade OH-bilderna är bara utkast till vad som kan vara.
1(31) Ett omdiskuterat ämne. Vad är det som händer? 2.
1 Föreläsning 6 Programmeringsteknik och Matlab 2D1312/2D1305 Metoder & parametrar Array API och klassen ArrayList.
Tillgänglighet - är det dyrt?
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
INT 3 F4 Medieteknik Del2 Komprimering, ljud och rörliga bilder DSV Peter Mozelius.
Enheten för IT och media Per Wising & Roland Fredriksson 10 april 2003 Rörlig bild på webben.
Anslutningar till/från systemenheten?
© Björn Hedin, NADA/KTH Media, Multimedia och videokodning 2D1518 Audio-, Video och Multimediaproduktion
Like.no.other ™ 1 En presentation från HD –På riktigt!
Multimedie- och kommunikations- system, lektion 1 Föreläsningsmaterialet är författat av Magnus Eriksson och Iskra Popova. Bilder är även hämtade från.
31 March 2015IS1200 Datorteknik, förel 101 IS1200 Datorteknik Föreläsning Processorkonstruktion 2. DMA, Direct Memory Access 3. Byte-code i JAVA.
31 March 2015 IS1200 Datorteknik ht2009 föreläsning 2, (D2)1 IS1200 Datorteknik Föreläsning 2 Vi bygger en processor Kursboken, valda delar av kapitel.
F1-be-03_PS1 Telekommunikation F1. F1-be-03_PS2 INFORMATION KODNING MODULATION KANALEN tid frekvens.
IS1200 Datorteknik Föreläsning CE F2 Vi bygger en processor Kursboken, delar av kapitel 7 31 March IS1200 Datorteknik föreläsning CE – F2.
Spektrala Transformer
Projekt i Projektledningskursen och Introduktion till Projektbaserad produktutveckling (“IPP-kursen”
Schemaläggning Mål –Att förstå den roll som schemaläggning och schemaläggnings-analys spelar för att förutsäga hur realtids-tillämpningar uppfyller sina.
Lektion 5 Mahmud Al Hakim
Inspelning och digitalisering
Kursplanering och kursmaterial
Modellbaserad Ljudkodning Kodning av tal Kodning av musik MPEG-4 Audio toolbox.
Det som man kan koppla till datorn. (periferienheter)
Repetition of some basic concepts. PCM = Pulse Code Modulation = Digital transmission of analogue signals Sampler AD-converter with seerial output
Räkna till en miljard 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13,14,15,16,17,18,19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, En miljard är ett.
Digitalteknik 7.5 hp distans: 4.6 Adderare 4.45 Adderare Addition av två tal innebär att samma förfarande upprepas för varje position i talet. För varje.
Digitalitet.
Generationsdubbel Inomhus januari 2010 Grupp A X X X 1 32 Jungqvist/Mannerfelt Westerberg Fabricius Jungqvist/Mannerfelt Westerberg Fabricius.
Multimedia och Pedagogik
Figure 6.7: Distorsion. Figure 6.4 FDM (Frekvensdelningsmultiplex, frequency division multiplex) Exempel på FDM-teknik: ADSL-modem, kabel-TV-modem, trådlös.
Muntligt redovisning LUBNA HASHIM. Skolan och elever  Lockeruds skolan i Mariestad  Årskurs 5  Lektioner i Sv, Eng,So och Matematik  Grej of the day.
Multimedie- och kommunikationssystem, lektion Forts. Kap 2: Signaler och Kvalitetsmått Kap 3-4: Ljud- och videokompression.
Enklare och snabbare vardag med uppkoppling via fiber
Grundläggande signalbehandling
Kapitel 4 AD – DA - omvandlare.
Introduktion till kursen Digitalteknik 3p
Presentationens avskrift:

Föreläsning 1: Bild- och ljudkodning 1. Kursöversikt 2. Introduktion till bild- och ljudkodning - syfte - historik - antal bitar per bildpunkter/sampel 3. Två principiella klasser : distorsionsfri och distorderande kodning 4. Modeller för bild- och ljudsignaler samt därav inspirerade kodningsmetoder

Kursöversikt - föreläsningar F1: Introduktion till bild- och ljudkodning F2: Informationsteoretiska begrepp F3: Källkodningsteori, Huffmankodning F4: Aritmetisk kodning, Lempel-Ziv-kodning F5: Analoga signaler, Skalär kvantisering F6: Vektorkvantisering F7: Prediktiv kodning F8: Transformkodning F9: Delband/Wavelet-kodning F10: Audiokodning F11: Videokodning F12: Talkodning, Modellbaserad videokodning, Video/audio över nätverk

Kursöversikt - övrigt 12 föreläsningar 8 lektioner 2 datorlektioner 2 laborationer (varav en är schemalagd) Kurslitteratur: K. Sayood, Introduction to Data Compression Diskreta Markovprocesser (kurshemsidan) Övningshäfte, formelsamling (kurshemsidan) Kurshemsida: www.icg.isy.liu.se/courses/tsbk02/ - labbokning, labbanvisningar, extramaterial

Bild- och ljudkodning Syfte: effektiv (digital) representation av bilder, video, tal och musik. Bivillkor: - god kvalitet - tålighet mot kanalfel - realtidsprestanda - kostnadseffektiv

Bild- och ljudkodning Bild/ Ljudkodning Telekommunikation Bildanalys Spektralanalys Bild/ Ljudkodning Perception Psykoakustik Datorgrafik Talsyntes Digital signalbehandling

Tillämpningar Stillbilder Fax Teleradiologi Webb Digitalkameror Bilddatabaser Video Bildtelefoni Videokonferens Multimedia Videokameror Digital-TV DVD, Blu-ray Ljud CD Mobiltelefoner MP3-spelare DAB Film/video-ljud

Telefoni g Ericsson 1905 Smartphone 2014

Television Baird 1930 OLED 2014

Den elektroniska bilden – analogt format Bilden avsöks linje för linje och ger upphov till en analog signal. I Bairds mekaniska TV-system användes 30 linjer och videobandbredd ca 10 kHz.

Den elektroniska bilden – digitalt format En bildpunkt representeras med en eller flera databitar. Representationen kallas Pulskods-modulation (PCM).

Bilder: hur många bildpunkter? Baird 30*50 (ca) TV (PAL) 720*576 HDTV 1920*1080 QFHD 3840*2160 Digitalkamera 2 - 40Milj.

Hur många bitar per bildpunkt? Bitar/bildpunkt Bildtyper Exempel 1 4 8 12-16 8*3=24 8*4=32 binära fax enkel datorgrafik tidiga spel gråskalebilder telefoto högkontrast röntgen Färgbilder (RGB) digital foto RGB med alpha datorgrafik

Ljud: antal bitar per sampel och per sekund (PCM-kodning) CD-kvalitet 16 bitar per sampel 44100 sampel per sekund Två kanaler =>1.4 Mbit/s Betraktas ofta som referens (”okomprimerat ljud”) Modern kodningsmetoder: 64 kbit/s med god kvalitet Digital telefoni 8 bitar per sampel 8000 sampel per sekund => 64 kbit/s Moderna kodningsmetoder: 4 kbit/s med god kvalitet

Video: antal bitar per sekund (PCM-kodning) TV-kvalitet 3*8 bitar (RGB) per bildpunkt 720*576 bildpunkter per bild (PAL) 25 bilder per sekund => 250Mbit/s HDTV-kvalitet 3*8 bitar (RGB) per bildpunkt 1920*1080 bildpunkter per bild (1080i) 25 bilder per sekund => 1.24Gbit/s

Video: kodningsmetoder Model-based Video coding 3G Mobile videophone Video CD Digital TV, DVD HDTV 8 16 64 384 1.5 5 20 kbit/s Mbit/s Very low bitrate Low bitrate Medium bitrate High bitrate MPEG-4 H.264 H.263 H.261 MPEG-1 MPEG-2

Distorsionsfri (”lossless”) kodning (Datakompression) Representera en digital signal med färre bitar än originalet på så sätt att signalen kan rekonstrueras exakt. Den undre begränsningen ges av entropin för data (baseras på Informationsteori). Exempel: ZIP, compress, GIF, PNG, FLAC

Distorderande (”lossy”) kodning Representera en digital eller analog signal med så få bitar som möjligt så att signalen kan rekonstrueras med godtagbar kvalitet. Exempel: GSM, JPEG, MPEG-2, H.264, MPEG-1 layer 3 (mp3), AAC, WMA,...

Typisk kodarstruktur Analog signal Digital Signal (PCM) Distorderad Sampling kvantisering Distorderande kodning Distorsionsfri Kodning

Kodning av bild och ljud bygger på modeller S(t) t Genereringsmodeller Signalmodeller Syn/hörsel-modeller 3D-objekt belysning kameraprojektion ljudgenerering determ. modeller statistiska modeller spatio/temporal modeller maskeringsegenskaper Modellbaserade kodningsmetoder Signalteoretiska kodningsmetoder Perceptionsbaserade kodningsmetoder

Statistiska signalmodeller Minnesfria signaler t Varje signalvärde är oberoende av övriga signalvärden. Signaler med minne Signalvärden är beroende av ett eller flera övriga signalvärden. t

Autoregressiv modell - en amplitudkontinuerlig Markovmodell xk xk = S aixk-i + nk nk: minnesfri process Lämpar sig väl för att modellera ljudsignaler

Korrelationsmodell För bilder kan 2-dimensionella korrelationsfunktioner vara användbara: xij eller xkl

Exempel på kodning av minnesfri källa Gråskalebild med nivåer mellan 0 - 3. Statistisk redundans: de olika nivåerna förekommer olika ofta (se figur). Kodningsmetod: Variabel-längdkodning (VLC) PCM 0 - 00 1- 01 2 - 10 3 - 11 VLC 0 - 0 3 - 10 1 - 110 2 - 111 2 bitar/bildpunkt 1.75 bitar/bildpunkt i genomsnitt!

Exempel på kodning av minneskälla Bildtyp: fax. Statistisk redundans: närliggande bildpunkter har ofta samma värde. Kodningsmetod: koda skurlängderna. Skurkod: 15,15,15,4,5,6,4,6,5,3,… Antag 4 bitar/skur: 45*4 = 180 bitar jfr. okodat: 15*15 = 225 bitar

Prediktiv kodning (DPCM) (för AR-processer) Princip: • gissa (prediktera) hur bilden ser ut, • beräkna skillnaden (felbilden), • variabel-längdkoda felbilden.

(för 2D-korrelerade källor) Transformkodning (för 2D-korrelerade källor) xij xkl

Modellbaserade kodningsmetoder - används vid kodning av talsignaler - och för kodning av ansiktsbilder

Perceptionsbaserade kodningsmetoder (är mer användbara för ljudkodning än för bildkodning) dB 40 30 20 Dämpningskurva 10 2 4 6 8 10 12 kHz

Fraktalkodning Grundidé: sök självliknande delar i bilden... sådan symmetri ger enkel matematisk beskrivning...

Fraktalkodning, forts. Varje bild kan göras självlik...