Examensarbete En central telefonitjänst för talaradaption med lagring och nedladdning till olika applikationer
Examensarbete Översikt Mål Användning Uppbyggnad Test och resultat Utvecklingsmöjligheter Sammanfattning
Examensarbete Mål Utveckla en telefonitjänst Verifiera att prestanda förbättras
Examensarbete Mål Utveckla en telefonitjänst –Skapa personliga talarmodeller –Lagra modellerna –Tillhandahålla modeller Verifiera att prestanda förbättras
Examensarbete Hur används tjänsten? Indelad i tre delar –Registrering –Adaption –Nedladdning Gemensam databas
Examensarbete Hur används tjänsten? Indelad i tre delar –Registrering –Adaption Samla in och kontrollera data Skapa modell Lagra modell –Nedladdning Gemensam databas
Examensarbete System översikt PST N INTERNE T REGISTRERINGNEDLADDNINGADAPTION GEMENSAMMA KOMPONENTER INTERNE T PROTOKOLL ANVÄNDARE PERSONLIGA MODELLER
Examensarbete Registrering PROTOKOLL SERVER ANVÄNDARE INTERNE T CLIENT WEB BROWSER WEB SERVER INTERNE T Dynamisk HTML Java applet
Examensarbete Registrering - Gränssnitt
Examensarbete Adaption PROTOKOLL PST N DIALOG- HANTERARE ANVÄNDARE PERSONLIGA MODELLER GLOBAL MODELL TALTEKNOLOGI TILLTALAD ADAPTIONS- SKRIPT
Examensarbete Adaption - Dialog D: Välkommen. Säg ditt användarnamn. A: Henrik D: Säg ditt lösenord. A: 1234 D: Hej Henrik, jag hoppas att du är redo att påbörja inläsningen. D: Läs yttrande nummer 1. A: Någon teknisk bevisning finns inte. D: Läs yttrande nummer 2. A: Där var trygghet och ljus. D: Läs yttrande nummer 2 igen. A: Fler ägare betyder ytterligare mångfald. D: Läs yttrande nummer 3. …
Examensarbete Nedladdning SERVER ANVÄNDARE INTERNE T PERSONLIGA MODELLER RÖSTSTYRD TELEFONITJÄNST PST N E-post Modell
Examensarbete Prestandatest 7 talare läste in 70 meningar. –Varje mening lästes 3 gånger. De 50 första meningarna användes vid adaptionen. De 20 sista användes som testmaterial. 4 olika tester: –Första försöket –Sista försöket –Alla försök –Bästa försöket
Examensarbete Adaption Ursprungsmodell –Material från 1000 talare ur SpeechDat –Inspelat över det fast telefonnätet –Fonemigenkänning Adaptionsalgoritmer –Maximum a Posteriori (MAP) skalningsfaktor 0.0 (Maximum Likelihood) skalningsfaktor 1.0 –Maximum Likelihood Linear Regression (MLLR)
Examensarbete Resultat Adaption på första yttrandet
Examensarbete Resultat Adaption på bästa yttrandet
Examensarbete Resultat Adaption på samtliga tre försök av varje yttrande
Examensarbete Utvecklingsmöjligheter Talarverifiering Låta de applikationer som användaren använder ladda upp talmaterial som kan användas för adaption. Fler talaroberoende modeller att välja på som ursprungsmodell för adaption. –Dialekt –Ålder –Kön
Examensarbete Utvecklingsmöjligheter Ta reda på vilken uttalsvariant som använts om flera möjliga uttal finns, t.ex. ”de” eller ”dom”. Förbättra adaptionsresultaten genom att kontrollera fonemen mer ingående. Detta för att undvika felträning.
Examensarbete Sammanfattning Tjänsten hanterar: –Inspelning –Adaption –Nedladdning Testerna visar: –Prestanda förbättring –Genom att välja bästa meningen erhålls bättre adaptionsresultat