Ladda ner presentationen
Presentation laddar. Vänta.
Publicerades avNiklas Mattsson
1
Introduktion till språkteknologi Introduktion
2
Språkteknologi Vi studerar vad som krävs för att få datorer att utföra nyttiga och intressanta uppgifter med mänskliga språk. Vi är också intresserade av de insikter som studier av datormodeller ger oss om det mänskliga språket. 2
3
Varför bry sig? 1.En enorm mängd kunskap är numera tillgänglig i form av maskinläsbar text 2.Samtalsagenter håller på att bli en viktig form av människa-dator-kommunikation 3.En stor del av vår kommunikation med andra människor förmedlas nu av datorer 3
4
Näringslivet Mycket på gång … 4
5
Google Translate 5
6
6
7
Webbsökning Mer och mer språkteknologi … 7
8
Frågebesvarande system Ett steg till … 8
9
Webb-bevakning Informationsextraktion från bloggar, diskussionsforum och andra former av användargenererade media Marknadsföring Opinionsundersökning Nätverksanalys Trendanalys 9
10
Röststyrning Tala med datorn (mobilen, TVn, spisen …) Hands free, eyes free 10
11
Språkstöd Skrivstöd: Stavningskontroll Grammatikkontroll Stöd för funktionshinder: Talsyntes för synskadade Stöd och träningsprogram för dyslexi och afasi Alternativ och kompletterande kommunikation Språkundervisning 11
12
Tillämpningar Vad gör en tillämpning språkteknologisk (till skillnad från annan programvara)? Den kräver att man utnyttjar kunskap om det mänskliga språket. Exempel: “Räkna ord” i Word Sidor? Ord? Tecken? Stycken? Rader? 12
13
Vad är problemet? Datorer förstår formella språk Programspråk (C, Java, Python …) Märkspråk (XML, HTML, …) Mänskliga språk har andra egenskaper Flertydighet Vaghet Ofullständighet Variation Produktivitet Redundans 13
14
Flertydighet Lexikal flertydighet Mellan ordklasser fiskar – verb eller substantiv? var – verb, adverb eller substantiv? Inom ordklass fil – verktyg, mejeriprodukt, datorterm eller körfält? Strukturell flertydighet Hon träffade killen med flaskan Syftningsflertydighet: Hon tappade glaset på bordet och det gick sönder 14
15
Vaghet och ofullständighet Många uttryck är vaga (oprecisa) Var går gränsen mellan eftermiddag och kväll? Vad är en stor respektive liten hund? Häst? Mycket lämnas outsagt: Hunden var glad. Svansen viftade oupphörligt. En dator som förstår dig som din mamma. 15
16
Variation Synonymi tjej flicka tös jänta Parafras Pelle bor i Uppsala. Det är i Uppsala Pelle bor. Pelle bor i staden med Nordens äldsta universitet. I Uppsala bor katten utan svans. 16
17
Produktivitet Språket får hela tiden nya ord och (inte minst) nya betydelser för gamla ord tjejsamla, tjejlyssna mus, skrivbord, ikon, papperskorg Antalet möjliga meningar är oändligt Det regnar och det blåser och jag har tandvärk och cykeln är trasig och … Vi uttrycker oss ofta indirekt (ironi, överdrift, underdrift, metaforer) Jag kommer att dö av skam. Hon var verkligen i toppform. 17
18
Redundans Samma betydelse signaleras på flera sätt Igår sken solen – förfluten tid En ny cykel – obestämdhet Behovet av redundans ökar med yttre omständigheter (buller, dålig täckning) 18
19
Vad behöver vi kunna? Lingvistik Kunskap om det mänskliga språket Datavetenskap Kunskap om datorer och formella språk Språkteknologi Specialiserade tekniker som kombinerar lingvistik och datavetenskap 19
20
Lingvistik Delområden Fonetik, fonologi, grafonomi – tal och skrift Morfologi och syntax – ord och meningar Semantik och pragmatik – betydelse och bruk Kurser på programmet Lingvistik I (1) Grammatik för språkteknologer (1) Semantik och pragmatik (2) Fonetik I (4) 20
21
Datavetenskap Delområden Programmering Matematisk modellering Maskininlärning Kurser på programmet Introduktion till datateknik för språkvetare (1) Matematik för språkteknologer (2) Programmering för språkteknologer I (2) Maskininlärning i språkteknologi (3) Programmering för språkteknologer II (3) 21
22
Språkteknologi Delområden: Bastekniker (tal/skrift, morfologi, syntax, semantik) Praktiska tillämpningar Kurser på programmet Introduktion till språkteknologi (1) Grundläggande textanalys (2) Syntaktisk analys i språkteknologi (3) Semantisk analys i språkteknologi (3) Talteknologi* (4) Maskinöversättning (4) Informationssökning (4) 22
23
Den här kursen Introduktion med fokus på tillämpningar Skrivstöd Språkinlärning Informationssökning Textklassificering Dialogsystem Maskinöversättning Språkteknologiska tekniker Tas upp för relevanta tillämpningar Övas i praktiska laborationer 23
Liknande presentationer
© 2024 SlidePlayer.se Inc.
All rights reserved.