Ladda ner presentationen
Presentation laddar. Vänta.
Publicerades avAnton Hansson
1
Examensarbete 2002-04-09 En central telefonitjänst för talaradaption med lagring och nedladdning till olika applikationer
2
Examensarbete 2002-04-09 Översikt Mål Användning Uppbyggnad Test och resultat Utvecklingsmöjligheter Sammanfattning
3
Examensarbete 2002-04-09 Mål Utveckla en telefonitjänst Verifiera att prestanda förbättras
4
Examensarbete 2002-04-09 Mål Utveckla en telefonitjänst –Skapa personliga talarmodeller –Lagra modellerna –Tillhandahålla modeller Verifiera att prestanda förbättras
5
Examensarbete 2002-04-09 Hur används tjänsten? Indelad i tre delar –Registrering –Adaption –Nedladdning Gemensam databas
6
Examensarbete 2002-04-09 Hur används tjänsten? Indelad i tre delar –Registrering –Adaption Samla in och kontrollera data Skapa modell Lagra modell –Nedladdning Gemensam databas
7
Examensarbete 2002-04-09 System översikt PST N INTERNE T REGISTRERINGNEDLADDNINGADAPTION GEMENSAMMA KOMPONENTER INTERNE T PROTOKOLL ANVÄNDARE PERSONLIGA MODELLER
8
Examensarbete 2002-04-09 Registrering PROTOKOLL SERVER ANVÄNDARE INTERNE T CLIENT WEB BROWSER WEB SERVER INTERNE T Dynamisk HTML Java applet
9
Examensarbete 2002-04-09 Registrering - Gränssnitt
10
Examensarbete 2002-04-09 Adaption PROTOKOLL PST N DIALOG- HANTERARE ANVÄNDARE PERSONLIGA MODELLER GLOBAL MODELL TALTEKNOLOGI TILLTALAD ADAPTIONS- SKRIPT
11
Examensarbete 2002-04-09 Adaption - Dialog D: Välkommen. Säg ditt användarnamn. A: Henrik D: Säg ditt lösenord. A: 1234 D: Hej Henrik, jag hoppas att du är redo att påbörja inläsningen. D: Läs yttrande nummer 1. A: Någon teknisk bevisning finns inte. D: Läs yttrande nummer 2. A: Där var trygghet och ljus. D: Läs yttrande nummer 2 igen. A: Fler ägare betyder ytterligare mångfald. D: Läs yttrande nummer 3. …
12
Examensarbete 2002-04-09 Nedladdning SERVER ANVÄNDARE INTERNE T PERSONLIGA MODELLER RÖSTSTYRD TELEFONITJÄNST PST N E-post Modell
13
Examensarbete 2002-04-09 Prestandatest 7 talare läste in 70 meningar. –Varje mening lästes 3 gånger. De 50 första meningarna användes vid adaptionen. De 20 sista användes som testmaterial. 4 olika tester: –Första försöket –Sista försöket –Alla försök –Bästa försöket
14
Examensarbete 2002-04-09 Adaption Ursprungsmodell –Material från 1000 talare ur SpeechDat –Inspelat över det fast telefonnätet –Fonemigenkänning Adaptionsalgoritmer –Maximum a Posteriori (MAP) skalningsfaktor 0.0 (Maximum Likelihood) skalningsfaktor 1.0 –Maximum Likelihood Linear Regression (MLLR)
15
Examensarbete 2002-04-09 Resultat Adaption på första yttrandet
16
Examensarbete 2002-04-09 Resultat Adaption på bästa yttrandet
17
Examensarbete 2002-04-09 Resultat Adaption på samtliga tre försök av varje yttrande
18
Examensarbete 2002-04-09 Utvecklingsmöjligheter Talarverifiering Låta de applikationer som användaren använder ladda upp talmaterial som kan användas för adaption. Fler talaroberoende modeller att välja på som ursprungsmodell för adaption. –Dialekt –Ålder –Kön
19
Examensarbete 2002-04-09 Utvecklingsmöjligheter Ta reda på vilken uttalsvariant som använts om flera möjliga uttal finns, t.ex. ”de” eller ”dom”. Förbättra adaptionsresultaten genom att kontrollera fonemen mer ingående. Detta för att undvika felträning.
20
Examensarbete 2002-04-09 Sammanfattning Tjänsten hanterar: –Inspelning –Adaption –Nedladdning Testerna visar: –Prestanda förbättring –Genom att välja bästa meningen erhålls bättre adaptionsresultat
Liknande presentationer
© 2024 SlidePlayer.se Inc.
All rights reserved.