Introduktion till språkteknologi Introduktion. Språkteknologi Vi studerar vad som krävs för att få datorer att utföra nyttiga och intressanta uppgifter.

Slides:



Advertisements
Liknande presentationer
Pragmatik Funktionellt perspektiv - studiet av språket i kontexten
Advertisements

Att identifiera och utveckla ledare
IKT i engelskundervisningen
1 Handelshögskolan i Stockholm 2 Lunds universitet
Gymnasiearbetet p..
Svenska som andraspråk
78 respondenter. 2 [1] Hur har det varit hemma sedan du var här sist?
• Frågeledaren är den som vet svaren. De finns under en länk på sidan i kalendern. • Ni behöver antingen en 12-tärning eller två vanliga tärningar. • Slå.
Från mönster till algebra
Pronomen.
Enterprising spirit! En profil för: Idérika Vetgiriga Kreativa Flickor och pojkar.
Centrum för lättläst
Att söka till högskolan
Att söka och förvalta kunskap
Använd svenska nu! Svenska som främmande språk •Mål •Språkinlärning •Bra kommunikation •Arbeta i grupper •Använda ny teknik •Utbyta erfarenheter.
Varför grammatik? Vad är ordklasser?
Vad har vi lärt oss? (What have we learned?)
Enkel dator teknik Tips och tricks.
SYNTAX Allmän Grammatik.
Hur kom Bibeln till? Torsdagen den 14 januari Kvällens ämne:
Välkommen! Cecilia Persdotter, Länsbibliotek Östergötland 1.
Språkteknologisk forskning och utveckling (HT 2007)
Vad har vi lärt oss? (What have we learned?)
På andra sidan Skrivuppgift hösten 2012.
Utbildningsdag i språkteknologi Mats Wirén TeliaSonera, Haninge Forskning och affärsutveckling.
Elkraft 7.5 hp distans: Kap. 3 Likströmsmotorn 3:1
IT och kommunikationsvetenskap Teresa Cerratto Pargman, DSV
Stora additionstabellen
Tecken som Alternativ och Kompletterande Kommunikation
Växjö 15 april -04Språk & logik: Reguljära uttryck1 DAB760: Språk och logik 15/4: Finita automater och 13-15reguljära uttryck Leif Grönqvist
Barn och Utbildning Föräldraenkät 2011 Totalt resultat förskola Svarsfrekvens hela enkäten (förskola och skola) 39 %
Programmering B PHP Lektion 2
Hur vill studenter bo? En studie av enrumslägenheter 1.
Från binära till hexadecimala
Programmering B PHP Lektion 3
Eva 10 år -Jag vet att det kostar, men hur lång tid kan det ta.
Barns tillgång till svenskt teckenspråk
Bakgrund! Piteå kommun skall lägga om strukturen i det befintliga nätverket. Det kommer att gå från tre system som löper paralellt med varandra till ett.
Gröna näringen – en framtidsbransch!. Sid 2 | Lantbrukarnas Riksförbund Välkommen till de gröna näringarna Varor och tjänster som alla behöver – 4 procent.
L U L E Å U N I V E R S I T Y O F T E C H N O L O G Y Datateknik Kort information om Datateknik.
Semantik Orden och deras betydelse (Sema = tecken på grekiska)
Bild 1 Hur använder vi KursInfo idag? Högskolan i Skövde.
Språkstörning och dess konsekvenser för inlärning
Det handlar om multiplikation
TÄNK PÅ ETT HELTAL MELLAN 1-50
Varför frågar vuxna bara en gång och sedan nöjer sig med svaret ”bra”?
Programspråk Två olika typer av program omvandlar högnivå till lågnivå program: Interpreterande program och kompilerande program. Python är ett interpreterande.
INFÖR NATIONELLA PROVET. UPPGIFT 1 Förenkla så långt som möjligt Ständigt återkommande uppgift!
Vad ska ingå i uppgiften?
Fakta om undersökningen
Logoped Lena Nilsson Logoped Elin Berglund
Jonny Karlsson INTRODUKTION TILL PROGRAMMERING Föreläsning 3 ( ) INNEHÅLL: -Jämförelseoperatorer -Villkorssatser -Logiska operatorer.
Gränsöverskridande i flerspråkig kommunikation med datorer Robin Cooper, professor i datalingvistik Föreståndare, Nationella forskarskolan i språkteknologi.
F. Drewes, Inst. f. datavetenskap1 Föreläsning 11: Funktionella språk Funktioner och variabler i matematiken Funktionella språk LISP, ML och.
INTRODUKTION TILL PROGRAMMERING
Institutionen för datavetenskap vid Helsingfors universitet PB 68 Gustaf Hällströms gata 2b Helsingfors universitet
-att förstå bildspråk liknelser, metaforer, idiom och ordspråk
Räkna till en miljard 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13,14,15,16,17,18,19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, En miljard är ett.
Musslan … för dig som har en närstående som dricker för mycket alkohol, tar droger eller mår psykiskt dåligt.
Matematik – Karl Johans skola i Örebro
Syfte: Undervisningen ska stimulera elevernas lust att tala, skriva, läsa och lyssna och därmed stödja deras personliga utveckling. Eleverna ska ges möjlighet.
Identitet Vad formar oss till oss?.
Multimedia och Pedagogik
1 Jan Lundström OV’s Hemsida Utbildning Ledare. 2 Jan Lundström OV’s Hemsida Standard Lagrum.
Huvudsatser och bisatser
Föreläsning 2 programmeringsteknik och Matlab 2D1312/ 2D1305
1 Semantik – introduktion Semantik = läran om mening Tvärvetenskapligt filosofi lingvistik psykologi AI Lingvistik motsägelser mångtydighet metaforer Filosofi.
Huvudsats och bisats– att bygga meningar
SPRÅKLIG MEDVETENHET/UPPMÄRKSAMHET
Enkel dator teknik Tips och tricks. Välja storlek och radavstånd Här väljer du storlek på texten vi vill att ni använder 14 p till rubriker och 12 p till.
Presentationens avskrift:

Introduktion till språkteknologi Introduktion

Språkteknologi Vi studerar vad som krävs för att få datorer att utföra nyttiga och intressanta uppgifter med mänskliga språk. Vi är också intresserade av de insikter som studier av datormodeller ger oss om det mänskliga språket. 2

Varför bry sig? 1.En enorm mängd kunskap är numera tillgänglig i form av maskinläsbar text 2.Samtalsagenter håller på att bli en viktig form av människa-dator-kommunikation 3.En stor del av vår kommunikation med andra människor förmedlas nu av datorer 3

Näringslivet Mycket på gång … 4

Google Translate 5

6

Webbsökning Mer och mer språkteknologi … 7

Frågebesvarande system Ett steg till … 8

Webb-bevakning Informationsextraktion från bloggar, diskussionsforum och andra former av användargenererade media  Marknadsföring  Opinionsundersökning  Nätverksanalys  Trendanalys 9

Röststyrning Tala med datorn (mobilen, TVn, spisen …) Hands free, eyes free 10

Språkstöd Skrivstöd:  Stavningskontroll  Grammatikkontroll Stöd för funktionshinder:  Talsyntes för synskadade  Stöd och träningsprogram för dyslexi och afasi  Alternativ och kompletterande kommunikation Språkundervisning 11

Tillämpningar Vad gör en tillämpning språkteknologisk (till skillnad från annan programvara)? Den kräver att man utnyttjar kunskap om det mänskliga språket.  Exempel: “Räkna ord” i Word  Sidor?  Ord?  Tecken?  Stycken?  Rader? 12

Vad är problemet? Datorer förstår formella språk  Programspråk (C, Java, Python …)  Märkspråk (XML, HTML, …) Mänskliga språk har andra egenskaper  Flertydighet  Vaghet  Ofullständighet  Variation  Produktivitet  Redundans 13

Flertydighet Lexikal flertydighet  Mellan ordklasser  fiskar – verb eller substantiv?  var – verb, adverb eller substantiv?  Inom ordklass  fil – verktyg, mejeriprodukt, datorterm eller körfält? Strukturell flertydighet  Hon träffade killen med flaskan Syftningsflertydighet:  Hon tappade glaset på bordet och det gick sönder 14

Vaghet och ofullständighet Många uttryck är vaga (oprecisa)  Var går gränsen mellan eftermiddag och kväll?  Vad är en stor respektive liten hund? Häst? Mycket lämnas outsagt:  Hunden var glad. Svansen viftade oupphörligt.  En dator som förstår dig som din mamma. 15

Variation Synonymi  tjej  flicka  tös  jänta Parafras  Pelle bor i Uppsala.  Det är i Uppsala Pelle bor.  Pelle bor i staden med Nordens äldsta universitet.  I Uppsala bor katten utan svans. 16

Produktivitet Språket får hela tiden nya ord och (inte minst) nya betydelser för gamla ord  tjejsamla, tjejlyssna  mus, skrivbord, ikon, papperskorg Antalet möjliga meningar är oändligt  Det regnar och det blåser och jag har tandvärk och cykeln är trasig och … Vi uttrycker oss ofta indirekt (ironi, överdrift, underdrift, metaforer)  Jag kommer att dö av skam.  Hon var verkligen i toppform. 17

Redundans Samma betydelse signaleras på flera sätt  Igår sken solen – förfluten tid  En ny cykel – obestämdhet Behovet av redundans ökar med yttre omständigheter (buller, dålig täckning) 18

Vad behöver vi kunna? Lingvistik  Kunskap om det mänskliga språket Datavetenskap  Kunskap om datorer och formella språk Språkteknologi  Specialiserade tekniker som kombinerar lingvistik och datavetenskap 19

Lingvistik Delområden  Fonetik, fonologi, grafonomi – tal och skrift  Morfologi och syntax – ord och meningar  Semantik och pragmatik – betydelse och bruk Kurser på programmet  Lingvistik I (1)  Grammatik för språkteknologer (1)  Semantik och pragmatik (2)  Fonetik I (4) 20

Datavetenskap Delområden  Programmering  Matematisk modellering  Maskininlärning Kurser på programmet  Introduktion till datateknik för språkvetare (1)  Matematik för språkteknologer (2)  Programmering för språkteknologer I (2)  Maskininlärning i språkteknologi (3)  Programmering för språkteknologer II (3) 21

Språkteknologi Delområden:  Bastekniker (tal/skrift, morfologi, syntax, semantik)  Praktiska tillämpningar Kurser på programmet  Introduktion till språkteknologi (1)  Grundläggande textanalys (2)  Syntaktisk analys i språkteknologi (3)  Semantisk analys i språkteknologi (3)  Talteknologi* (4)  Maskinöversättning (4)  Informationssökning (4) 22

Den här kursen Introduktion med fokus på tillämpningar  Skrivstöd  Språkinlärning  Informationssökning  Textklassificering  Dialogsystem  Maskinöversättning Språkteknologiska tekniker  Tas upp för relevanta tillämpningar  Övas i praktiska laborationer 23