Digitalisering av text och bild - teori och praktik Jan Buse D 504 jan.buse@hb.se Vt 05
Introduktion Fokus på centrala aspekter i den faktiska digitaliseringsprocessen, t ex: Teknik bakom digitala bilder (vektor- och punktgrafik) Färgdjup Bildpunkter och upplösning Syfte & urval Typ av dokument Fångst Justering & efterbehandling Lagringsformat
Introduktion forts… Att en bild är digital innebär att den är lagrad som siffror, ettor och nollor: 1110110010100011101001110 (osv, osv) = För att digitala bilder skall kunna ses krävs programvara som kan koda om siffrorna till synliga bildelement. Viktigt att vara medveten om att den digitala kopian är någonting annat än originalet. Det är en representation, ett surrogat, med speciella egenskaper. En mängd faktorer i digitaliseringsprocessen styr vilka egenskaper det digitala dokumentet får.
Teknik bakom digitala bilder Det finns endast två typer av tekniker vid skapande av digitala bilder: Vektorgrafik Punktgrafik Alla digitala bilder är gjorda antingen i den ena, eller andra tekniken, eller både och. De två teknikerna är en av de faktorer som i hög grad påverkar bildens egenskaper.
Vektorgrafik Bilder i vektorgrafik är uppbyggda av kurvor och linjer s k vektorer. Dessa beskrivs och definieras matematiskt av ritprogrammet. Noder Linje Kurva Vid arbete i ett grafikprogram, översätts det ritade till noder och koordinater, och lagras därefter som en formel i datorn.
ABC… Utmärkande drag hos vektorgrafik Den tar litet minnesutrymme, då bilden endast lagras som en matematisk formel. Konturer på bilder blir helt skarpa, man slipper taggiga kanter. Kan förstoras, förminskas och förändras hur som helst utan att kvalitén försämras = Behöver inte i förväg bestämma slutgiltig storlek, bra format att jobba i under skisstadiet. Tekniken lämpar sig väl till bilder med hela ytor i samma färg, som text, loggor, teckningar och annan enklare grafik. Vektorgrafik är särskilt nödvändig till bilder som skall skrivas ut på papper. ABC…
Punkt- eller rastergrafik Bilder som är uppbyggda med punktgrafik består av en mängd punkter, s k pixlar. Bildens minsta beståndsdel är alltså pixeln. En bild som skapas med punktgrafik kan liknas vid att måla en bild på rutat papper genom att fylla de olika rutorna med färg. Taggar Pixel
Punkt- eller rastergrafik forts… En bild i punktgrafik beskrivs inte med en matematisk formel, utan genom hur många pixlar den totalt består av. 3000 pixlar Bildens format är 3000 X 3000 pixlar. Bildens totala pixelmängd är 3000 X 3000 = 900 000 pixlar Ofta är ett viktigt värde också hur tätt pixlarna sitter. Detta anges i pixels per inch (tum), ppi, eller som dots per inch, dpi. 3000 pixlar
Punkt- eller rastergrafik forts… Hur en digital bild kan användas styrs i hög grad av antalet bildpunkter, eller pixlar, den består av. Vid digital fotografering och skanning bestäms hur många pixlar en bild skall ha. I skannrar går det ofta att även ange hur tätt pixlarna skall sitta. Publicering på skärm kräver betydligt mindre antal pixlar än utskrift eller tryck på papper. Om digitaliseringen syftar till att skapa en arkivkopia, eller ett faksimil, ställs ännu högre krav på antal pixlar som bilden behöver bestå av.
Utmärkande drag hos punktgrafik Minsta beståndsdel är pixeln. Kräver mycket minne. Redigering försämrar bildens kvalité, vilket innebär att... En pixelbild i förväg noggrant måste anpassas till var den skall publiceras, som på nätet, i tryck, eller utskrift. Tekniken lämpar sig för fotografier, och andra typer av bilder med jämna tonövergångar. Alla typer av inskannat* material, och alla digitala fotade bilder (stillbild och film), samt bildmaterial på webben är i punktgrafik.
Verklighet/originalbild, Färgdjup - punktgrafik När en bild digitaliseras delas ”verklighetens” kontinuerliga valörskala upp i ett antal bestämda steg. För att skalan skall uppfattas som jämn, måste skillnaderna mellan varje steg vara så liten att de inte syns för det mänskliga ögat. Ett svartvitt foto kräver t ex minst 200 gråskalesteg mellan svart och vitt. Många bilder som visas på skärm har en valörskala som omfattar 256 nyanser i varje färg (d v s av primärfärgerna rött, grönt och blått). Begränsad valörskala, 100-tals toner Verklighet/originalbild, miljontals toner Digitaliserad bild i bestämda tonsteg Vid digitalisering för kulturarvsbevarande är kraven mycket höga på trovärdig återgivning av förlagans hela ton- och valörrikedom i kopian.
Färgdjup – punktgrafik forts… Den minsta enhet som något kan lagras i, en etta eller nolla, kallas för bit. Strängar av ettor och nollor fungerar som koder, och översätts i olika programvaror, till t ex en bokstav eller en färg: 11100100 Ju fler kombinationsmöjligheter av ettor och nollor som går att göra, desto fler olika tecken eller färger kan kodas. För att skriva text behövs ofta 8 bitar. Då kan varje ”nödvändigt” tecken i en text översättas till ettor och nollor: = 2 x 2 x 2 x 2 x 2 x 2 x 2 x 2= 256 Ett binärt tal med åtta bitar ger alltså 256 möjliga kombinationer. Och antalet färger en punktuppbyggd bild maximalt kan ha bestäms således av antalet tillgängliga bitar i en dator.
Färgdjup – punktgrafik forts… Det vanligaste färgdjupet när man arbetar med enklare grafik är 8 bitar/bildpunkt=256 färger. 1 bit/bildpunkt, 2 färger 4 bitar/bildpunkt, 16 färger 8 bitar/bildpunkt, 256 färger Varje färg i bilden hämtas från en palett. Färgerna är s k indexerade. Varje kombination av ettor och nollor pekar i själva verket på en bestämd position i paletten. Om positionens färg ändras, ändras samma färg i bilden.
Färgdjup – punktgrafik forts… Det minsta rekommenderade färgdjup för att hyfsat troget återge fotografiers färg- och tonskala är 24 bitar. En 24 bitars bild består av tre färgkanaler: rött, blått, grönt. Varje kanal förfogar över åtta bitar för att återge dess kanals färgrymd. Bilden är då i s k RGB-färgläge. Åtta bitar = = 256 toner rött Åtta bitar = = 256 toner grönt 16, 7 milj. toner Åtta bitar = = 256 toner blått Vid digital arkivering av kulturarv, och för att kunna göra kopior av faksimilkvalité, är det vanligtvis önskvärt med mer än åtta bitar per kanal. Vanligen rekommenderas 12, 14 eller 16 bitar per kanal. Men en bild i 16 bitar blir dubbelt så stor som en i 8 bitar...
Principer för färgvisning Det finns olika metoder för att översätta naturliga färgers kontinuerliga valörskala, till begränsade valörskalor med bestämda steg. Metoderna kallas färglägen eller färgmodeller, och är oftast anpassade till speciella typer av bilder och publiceringssätt. En bilds färgläge påverkar hur många, och vilka, färger som kan återges, och styr även bildens filstorlek. Vanliga färglägen är: NMI, RGB, CMYK, Indexerad färg, Lab-läge. Lab RGB CMYK
Principer för färgvisning forts… RGB och CMYK är de vanligaste färglägena för digitala färgbilder. RGB-läget är anpassat för visning på skärm. Alla typer av bildmaterial (foton, film mm) som projiceras på skärm (dator, tv, filmduk) är i RGB-färgläget. CMYK-läget är utvecklat för bilder som skall skrivas ut eller tryckas. Additiv färgblandning - RGB Vid färgblandning på en skärm är utgångsfärgen svart, d v s inget ljus. Olika kulörer uppstår när man ökar ljusstyrkan på skärmens tre färgkomponenter tills rätt kulör och ljusstyrka uppnås. Subtraktiv färgblandning - CMYK Vid färgblandning i tryck är utgångspunkten vitt papper och en ljuskälla som avger vitt ljus. Olika kulörer uppstår när delar av ljuskällans spektrum filtreras bort av de transparenta tryckfärgerna.
Principer för färgvisning forts… Både RGB och CMYK är enhetsberoende. Det betyder att färger kan variera mellan olika enheter (d v s skannrar, skrivare, skärmar, kameror mm). Detta innebär att det inte finns några absoluta RGB- eller CMYK-färger. Lab är däremot en enhetsoberoende teoretisk referensfärgrymd. A. Ljusstyrka = 100 (vitt) B. Grönt till rött C. Blått till gult D. Ljusstyrka = 0 (svart) Lab-färgmodellen
Syfte & urval Syftet med en digitaliseringsprocess måste var känt innan arbete börjar: Varför digitalisera? Original har låg beständighet (”räddar” försvinnande kulturarv genom digitalisering) För att förebygga nedbrytning (t ex populära dokument) För att sprida kultur och litteratur Marknadsföring (t ex en orts kulturhistoria) Forskning Kommersialism Digitalisera vad? Allt? (rationaliseringsaspekter) Ett urval (det tekniskt möjliga, det mest angelägna, det mest populära?
Typ av dokument Text, bild, tredimensionella objekt Textdokument Status & format (hur digitalisera, utrustning, handhavande?) Textdokument Det intellektuella innehållet? (räcker OCR?) Texten som bild (typsnitt, formatering, struktur, marginalanteckningar, missfärgningar, ”dold text” mm) Bilddokument Påsikts- eller genomsiktsbilder? Positiv eller negativ? Papper, celluloid, glas etc? Monokrom eller polykrom? Extra viktiga bildelement (t ex arkitekturdetaljer, människor)?
Fångst Skanner (flatbädd-, film-, trumskanner) Upplösning – optisk kontra interpolerad Histogram Elektronik (brus) Program för justering & behandling? Filmtypsinställning, automatisk maskbortagning? ”Mjuk skanning”? Kamera (analog, digital) Pixlelmängd Optik Lagringsformat (Jpeg, TIFF, Raw?) OCR (dvs, programvaror för OCR) Språk Typsnitt Formatering Smuts- skadehantering Typing (dvs, knacka in text för hand) Ladda ned från nätet (t ex, från textarkiv)
Justering & efterbehandling Redigering Manuell korrigering av OCR-missar Justering Toner, färger Efterbehandling Lyfta fram ”dold” information Rekonstruera ursprungligt utseende Retusch av skador (damm, repor, kaffe, klotter mm) Skärpa Anpassa upplösning & storlek till slutpublicering Konvertering till lämpligt lagrings- eller publiceringsformat
Lagringsformat De vanligaste, och mest användbara, filformaten för lagring bilder i punktgrafik är: TIFF (Tagged Image Format File) JPEG (Joint Photographic Expert Group) GIF (Graphics Interchange Format) PNG (Portable Network Graphics) Vid sidan av dessa format finns en rad andra, med olika egenskaper och användningsområden. Det kan röra sig om format som tillåter panorering och zoom (t ex FlashPix, MR SID, DjVu), som innehåller en rad komprimeringsalternativ (t ex JPEG2000, SPIFF, FlashPix, ), som är anpassade för speciella programvaror (t ex Photoshop .psd, Illustrator .ai).
Lagringsformat forts… Vad gäller vektorgrafik är följande några av de mest användbara: AI Adobe Illustrator Mycket spritt format för vektorgrafik, fungerar både för mac och pc. EPS (Encapsulated Postskript) Standardformat för bilder i vektorgrafik. SVG (Scalable Vector Graphic) Är ett språk för att beskriva tvådimensionell grafik i XML. CGM Computer Graphics Metafile Stöds av många programvaror för PC, menad som standard för vektorgrafik.
Litteraturtips Haugland, Astrid (2004) Digital bild- och fotobehandling . Sundbyberg. Pagina. 492 s. Fulton, Wayne (1997-2005) A few scanning tips . http://www.scantips.com/ (skanning, filformat, upplösning mm) Kvalitet och standard – en praktisk vägledning vid digital bildbehandling (2001-2002) Ett samverkansprojekt mellan Kungl.biblioteket, Nationalmuseum, Riksantikvarieämbetet och Riksarkivet) http://abm.kb.se/akt4cd/def_gr.htm’