Presentation laddar. Vänta.

Presentation laddar. Vänta.

Examensarbete 2002-04-09 En central telefonitjänst för talaradaption med lagring och nedladdning till olika applikationer.

Liknande presentationer


En presentation över ämnet: "Examensarbete 2002-04-09 En central telefonitjänst för talaradaption med lagring och nedladdning till olika applikationer."— Presentationens avskrift:

1 Examensarbete 2002-04-09 En central telefonitjänst för talaradaption med lagring och nedladdning till olika applikationer

2 Examensarbete 2002-04-09 Översikt Mål Användning Uppbyggnad Test och resultat Utvecklingsmöjligheter Sammanfattning

3 Examensarbete 2002-04-09 Mål Utveckla en telefonitjänst Verifiera att prestanda förbättras

4 Examensarbete 2002-04-09 Mål Utveckla en telefonitjänst –Skapa personliga talarmodeller –Lagra modellerna –Tillhandahålla modeller Verifiera att prestanda förbättras

5 Examensarbete 2002-04-09 Hur används tjänsten? Indelad i tre delar –Registrering –Adaption –Nedladdning Gemensam databas

6 Examensarbete 2002-04-09 Hur används tjänsten? Indelad i tre delar –Registrering –Adaption Samla in och kontrollera data Skapa modell Lagra modell –Nedladdning Gemensam databas

7 Examensarbete 2002-04-09 System översikt PST N INTERNE T REGISTRERINGNEDLADDNINGADAPTION GEMENSAMMA KOMPONENTER INTERNE T PROTOKOLL ANVÄNDARE PERSONLIGA MODELLER

8 Examensarbete 2002-04-09 Registrering PROTOKOLL SERVER ANVÄNDARE INTERNE T CLIENT WEB BROWSER WEB SERVER INTERNE T Dynamisk HTML Java applet

9 Examensarbete 2002-04-09 Registrering - Gränssnitt

10 Examensarbete 2002-04-09 Adaption PROTOKOLL PST N DIALOG- HANTERARE ANVÄNDARE PERSONLIGA MODELLER GLOBAL MODELL TALTEKNOLOGI TILLTALAD ADAPTIONS- SKRIPT

11 Examensarbete 2002-04-09 Adaption - Dialog D: Välkommen. Säg ditt användarnamn. A: Henrik D: Säg ditt lösenord. A: 1234 D: Hej Henrik, jag hoppas att du är redo att påbörja inläsningen. D: Läs yttrande nummer 1. A: Någon teknisk bevisning finns inte. D: Läs yttrande nummer 2. A: Där var trygghet och ljus. D: Läs yttrande nummer 2 igen. A: Fler ägare betyder ytterligare mångfald. D: Läs yttrande nummer 3. …

12 Examensarbete 2002-04-09 Nedladdning SERVER ANVÄNDARE INTERNE T PERSONLIGA MODELLER RÖSTSTYRD TELEFONITJÄNST PST N E-post Modell

13 Examensarbete 2002-04-09 Prestandatest 7 talare läste in 70 meningar. –Varje mening lästes 3 gånger. De 50 första meningarna användes vid adaptionen. De 20 sista användes som testmaterial. 4 olika tester: –Första försöket –Sista försöket –Alla försök –Bästa försöket

14 Examensarbete 2002-04-09 Adaption Ursprungsmodell –Material från 1000 talare ur SpeechDat –Inspelat över det fast telefonnätet –Fonemigenkänning Adaptionsalgoritmer –Maximum a Posteriori (MAP) skalningsfaktor 0.0 (Maximum Likelihood) skalningsfaktor 1.0 –Maximum Likelihood Linear Regression (MLLR)

15 Examensarbete 2002-04-09 Resultat Adaption på första yttrandet

16 Examensarbete 2002-04-09 Resultat Adaption på bästa yttrandet

17 Examensarbete 2002-04-09 Resultat Adaption på samtliga tre försök av varje yttrande

18 Examensarbete 2002-04-09 Utvecklingsmöjligheter Talarverifiering Låta de applikationer som användaren använder ladda upp talmaterial som kan användas för adaption. Fler talaroberoende modeller att välja på som ursprungsmodell för adaption. –Dialekt –Ålder –Kön

19 Examensarbete 2002-04-09 Utvecklingsmöjligheter Ta reda på vilken uttalsvariant som använts om flera möjliga uttal finns, t.ex. ”de” eller ”dom”. Förbättra adaptionsresultaten genom att kontrollera fonemen mer ingående. Detta för att undvika felträning.

20 Examensarbete 2002-04-09 Sammanfattning Tjänsten hanterar: –Inspelning –Adaption –Nedladdning Testerna visar: –Prestanda förbättring –Genom att välja bästa meningen erhålls bättre adaptionsresultat


Ladda ner ppt "Examensarbete 2002-04-09 En central telefonitjänst för talaradaption med lagring och nedladdning till olika applikationer."

Liknande presentationer


Google-annonser