DICO-möte KTH 2007-03-08 Anteckningar. Anteckningar (GU: Logga interaktioner; ASR-resultat, etc) Ytterligare dimensioner för prompt design –Uppläst -

Slides:



Advertisements
Liknande presentationer
Idéer för ett bredare entreprenörskap
Advertisements

Thommy Sjölander och Ulf Lundgren, MRO Software AB
TILLSAMMANS KAN VI GÖRA SKILLNAD VAR MED I EN ENTREPRENÖRIELL UTMANING.
Tyck till på Lnu.se Feedback/förslagslådor – vad ger det?
ClaroReadPro V5 B engt Österlind Solna Skoldatatek 18 november 2009.
Statistikmodulen Omicron Syntax Data AB Framåt.
Månadsbrev oktober 2013 Måsen
Hålltider för dagen 9.00 Kaffe 9.30 Inledning, start
GRUPPBEHANDLING AV SPELBEROENDE
Application within Transport Efficiency Feasibility study of the electricfication of the urban goods distribution transport system Elektrifierad stadsdistribution.
Mobilen – en central funktion för mycket av det vi gör i idag…
Serverkampanj för mellanmarknaden – genom partnerpresentation: Bild endast för presentatör: visa inte Talare: Partner Presentationens titel: Kraften att.
Access med Sebastian och Robert
Att söka och förvalta kunskap
CINERGY – kreativ samverkan och verktyg för regional tillväxt Regionala nämnden 14 september 2011.
SND: Erfarenheter av hantering av forskningsdata Iris Alfredsson, Svensk nationell datatjänst Hantering av forskningsdata Workshop vid Luleå tekniska universitet.
© 2013 IBM Corporation Pure Data for Analytics (Netezza) David Rådberg BigData Sales SWE.
Avalon Information Systems Vi är IT-företaget som behärskar framtagning av information och utveckling av konkurrenskraftiga IT-system. - Produktinformation.
Videokonsultation med medborgare
ny dag redo för en Business Value Launch /3/2017 8:37 PM 1
1 Välkommen till dagens e-möte –Säkerställ ljud via Meeting > Audio Setup Wizard –Slå av din mikrofon –Stäng av din kamera –Använd funktionen ”Raise hand”
Tillsammans gör vi studier möjligt
Analys och validitet av systemstudier med MERLIN-baserade simuleringsmodeller Casper Hildings.
Integrerade Nätverk i Hemsjukvården För Personer Med Diabetes
Bild 1 Välkomna! Lärarhandledning: 1.
Community Readiness Baseras på teorier om Community Developement -Organisationsteori -Psykologiteorier Har använts inom alkohol och drogmissbruk, våld.
En PowerPoint om PowerPoint
Pedagogiska året Hanvikens förskola
If you want to build a ship, don´t herd people together to collect wood and don´t assign them tasks and work, but rather teach them to long for the endless.
Seminarium inför revidering av mobil LRIC  Agenda  Bakgrund och syfte - varför revidera mobil LRIC?  Hur revidera mobil LRIC?  Parallella.
Utbildarutbildning Ny organisation fr o m 1/ IdrottOnline (5 personer) IT/Drift (5 personer)
VIS VerksamhetsInformationsStöd Länk:
Föräldramöte Team Agenda Viggan Vårcup 11/3 (Oskar) Anmälan på andra cuper under våren (Johan) Träningsplan för Team 03 (Fredrik) Aktiviteter.
IQFleet. Utvärdering av konceptet fordonståg i verkliga trafikförhållanden. Utveckla simuleringsverktyg för att prediktera trafikflöden på motorväg, genom.
Att lyckas med produktionssättning av Ladok3
Standardisering ger dig mer tid Peter Frodin. EFFECT-Direct / BDD Systems Management Server (SMS) Infrastucture Optimization Model (IOM) Vista Nästa steg.
Projekt och Arkitektur
1 onTarget project management TM VÄLKOMNA EFFEKTIV KOMMUNAL E-FÖRVALTNING INKLUSIVE SKOLPORTAL Microsoft och Sigma.
Känna till och ha provat metoder och verktyg för processledning
Kravönskemålsprocessen LPL-möte Umeå. Bakgrund i korthet »Införandestöd och projektsupport Skapa upp ett ramverk (Jira) för att hantera support.
Elisabeth Ingesson, Kalmar Läns Landstingsavdelning 097
Jannike Sköldebjer Mona Wikman
Exempelbaserade specifikationer med SpecFlow
Myter, fakta och lösningar
Gränsöverskridande i flerspråkig kommunikation med datorer Robin Cooper, professor i datalingvistik Föreståndare, Nationella forskarskolan i språkteknologi.
1 DEPEND Development of Evaluation and research Platform for ENvironmental Driver support FFI Transporteffektivitet – Projektseminarium 23/ Linus.
Nätverksträff i Aronsborg mars 2007 Att få en djup förståelse av vardagsverksamheten.
Viktigt när du upphandlar molntjänster
Ortsutveckling Skebokvarn
Designstöd Daniel Fällman Institutionen för informatik Umeå universitet Design och utvärdering, 5 poäng.
1 Logging and monitoring of TCP traffic in SSH tunnels Masters thesis Anton Persson.
Microsoft Visual Studio och.NET Framework, idag och imorgon! Robert Folkesson
Lunds universitet / Samordnat IT-stöd vid LU / Oktober 2009 NETinfo Samordnat IT-stöd vid LU Johnny Nilsson, PL Birgitta Lastow, bitr. PL Anders.
Forskning om dialog och dialogsystem på inst. för lingvistik målsättning: –utveckla teorier om mänsklig dialog som kan användas i byggandet av dialogsystem.
1 Demo två webbapplikationer styrgruppsmöte : RÄDDNINGSTJÄNSTEN FÄLT GEOSTAB m. fl. WMS Databas (SGI) RTJ FÄLT.
Nuance i Göteborg Nuance workshop Sthlm 3/
Välkommen till Strands BK´s upptaktsträff :30 Startar vi med en process 10:45Grunder i spärrspel 12:00 SISU bjuder på lunch på Hot Chili 13:00Första.
FÖ8a-VT07 TFYY98/TFKI13 - A.Henry/D.Lawrence 1 Ingenjörsprojekt för Teknisk Biologi och Kemisk Analysteknik Projektet, Under- och Efter-fas (Fö8a - vt2007)
Föreläsning om RUP RUP – Rational Unified Process
Framtidskartläggning
Prototyper Grupp 4 Fredrik Persson | Mahdi Bawaqneh | Maksim Nikitin | Sverre Brecheisen.
1 Välkommen till dagens e-möte –Säkerställ ljud via Meeting > Audio Setup Wizard –Använd funktionen ”Raise hand” om du vill ställa fråga –Eller använd.
Öppen frågestund Den 29 mars 2017.
För enklare verksamhetsutveckling och samverkan mot en smartare välfärd SKL har, tillsammans med GR, tagit fram en digital samverkansplattform där man.
Öppen frågestund Den 4 maj 2017.
Malin Forssell, Karolina Henningsson
Samtal kräver interaktion
Öppen frågestund 14 mars 2018 Adobe Connect.
Sprintdemo 10. Sprintdemo 10 Dagens program Teknik för demo: Kontakt med projektet: Join.me för både ljud och bild Inspelad demo på projektwebben Kontakt.
Presentationens avskrift:

DICO-möte KTH Anteckningar

Anteckningar (GU: Logga interaktioner; ASR-resultat, etc) Ytterligare dimensioner för prompt design –Uppläst - talspråk –Talhastighet Problem? –Användarens preferenser förändras över tid; tillvänjning –Dock: vi gör demosystem; förstagångsanvändare –Enkel lösning: flera varianter; användare kan välja explicit Dimensioner & tester –Formell + kortfattad vs. Informell + verbos –? Informell + kortfattad vs. Formell + verbos Plan, förslag –V. 13: nuvarande system (TTS); (möjligen vissa variationer???) Testa Inspelningsgrejor Testa prata med dico i bilen –Senare: inspelade prompter –Ännu senare: unit selection-syntes (USS) Fråga: hur funkar det med USS för chat?

Anteckningar Demo av chat (KTH) Koppling till GoDiS –Hur nära ska integration vara? Skäl för stark integration: –säkerhet; kunna hantera avbrott etc även när man dikterar –System ska kunna ta initiativ (t ex navigering) och tillfälligt avbryta chat –Interaktion med andra applikationer, t ex adressbok –Att göra för att koppla till GoDiS Skrivet i C#,.net Modularisera, bygg OAA-agenter Koppla till GoDiS-resurser Växla mellan taligenkännare? Pipea ljudströmmar? –Visuell feedback för inmatning Ersätta med feedback? –Hur växla mellan diktering och kommando? Dialoghanteringsproblem? Eller lösas med knapp? Nu: ”skicka till mobiltelefon ” –Olika behov av feedback för MSN och SMS Viktigare få rätt för SMS

Anteckningar Attityder till textning etc i bilen (Cars) –”Deadly Driver Distractions” –Behövs: argument att det är säkert Eller åtminstone lika säkert som –Handsfree-telefoni? –Tala med medpassagerare? Eller åtminstone säkrare än att knappa på mobilen? Distraktionsmätning –Lane change task i simulator? –Med vardagssamtal (ej räkna etc.) Person bredvid Över telefon –Med människa-människa-telefonsamtal –Med system känsligt för avbrott –Med system ej känsligt för avbrott –Ingår detta i projektet? Preliminära resultat: avbrott & återupptagnig (GU) –Förslag till utvidgning: GPS, stressnivåsignal Kan visa hur det blir när ”systemet” avbryter med annan uppgift, eller vill pausa

Anteckningar Hur väga samman stressdetektor + verbala signaler? –Låt alltid föraren interagera om den vill –Om användaren blir tyst & stress detekteras, avvakta –System tar ej initiativ (till nytt samtalsämne) om stress detekteras Beror delvis på hur viktigt det är; ibland kan undantag göras för tidskritiska uppgifter, t ex navigation Finns andra tidskritiska saker som lämpar sig för tal? [Johan kollar upp] –(Finns: system släpper ej igenom telefonsamtal om stress detekteras) –Generellt, 4 fall av avbrott/ämnesbyte och återupptagning 1.Användare initierar avbrott 2.Användare initierar ämnesbyte 3.System initierar avbrott 4.System initierar ämnesbyte Vill vi undvika (2)? –Stresssignaler är kortvariga (4 sek max)

Anteckningar Nästa möte –Efter analys av resultat av klinik 1 v. 18 –Johan mailar förslag –Punkter: Slutmål/demos –grad av integration –Samarbete/kontaktytor Applikationer Utbetalningar –Alla kollar om de fått utbetalning 2 Rapportering – hur funkar det? (Johan kollar) –Datum för progress reports –WP-rapporter? Websida –(Exempel: –Multimedia? –Offentlig hemsida vs. Privat arbetsyta (wiki) Ev. på samma ställe Wiki på webhotell eller GU? –Vem bygger? (Johan kollar) –Alla hjälper till med content –Logo: ”DICO” med Volvos typsnitt; PTT-knapp

Iterationer Iteration 1 (sept 06-maj 07) –Explorativa / visionära insamlingar –Dico version 1(a) – existerande system –Klinik 1(a) Testa setup in-vehicle (testa prompt design) Loggning?? –Dico version 1(b) – inspelat tal –Klinik 1(b) Testa promt design –Ev. klinik 1(c) Utökat test av prompt design Iteration 2 (maj 07-okt 07) –Dico version 2 2 nya applikationer Nytt grafiskt interface ”ny” GoDiS-version (TALK) WOZ-agent för att testa hantering av –avbrott och återupptagning –utökad hantering av feedback –Utökad systemfeedback (realtid) PTT –Klinik 2 Testa kognitiv belastning med/utan WOZ Simulator? Loggning synkad med A/V Iteration 3 (nov 07-april 08) –Dico version 3 4 applikationer Avbrott och återupptagning Utökad hantering av användarfeedback Realtidsfeedback från system? –Klinik 3 Utvärdera helhet inför slutversion Iteration 4 (maj 08-dec 08) –Slutversion, demo –Mer integrerad i testbil –Slutklinik Validering av säkerhet (Cars) Att diskutera: –Nu: fokus på personbil –Andra fordon i iterationer? Lastbilar? Grävskopor? –Revidera vilka applikationer vi ska göra (utöver chat, mp3) –Kravställare – mer explicit

Todo, Klinik 1 Inspelningssetup –Omnimic + video –Loggning m trindikit, inkl. ljudfiler (användar- och systemtal) –Synkning? –Verktyg för visualisering? –Ljud ut: PC-högtalare –Ljudsignal för synkning (klappa) Frågor –Ska varje person testa flera varianter? Kräver flera uppgifter -> mer inspelning av prompter –(Overhearer tests?) Förutsättningar –Ingen radio på –Inte prata i mobil –… Klinik 1(a) –TTS –Tekniskt test –Vi själva är ”testpersoner” –Cars (Cecilia/Fredrik) ordnar bil –När? Vecka 13 Onsdag 28/3 08:00-17:00 –Var ska vi köra? Lundby strand –Vilka av oss? Johan, Staffan, Jessica, Anders, Cecilia, Fredrik –Komplettera setup-bild (finns på DICO-sajten) –Samla ihop alla prylar Video, 220V, Omnimic (Johan) Dator för GoDiS, högtalare (GU) –Möte, testa koppla ihop ”på skrivbord” 22/3 kl. 13, dialoglabbet/VTEC Klinik 1(b) –Inspelat tal/domänsyntes –2 betingelser, handfull personer –C:a 30 min/person –Formulär: utforma –Uppgift(er) till försökspersoner: skriv ner –Simulation/bil Bil, för att lära oss –Testledare Starta systemet, sköta inspelning etc Testledare sitter bakom skynke Påpeka att testperson ej ska prata med testledare –Hur starta/stoppa systemet? Säg ”DICO!” –När? v. 18 –Var ska vi köra? Klinik 1(c) –Om bedöms meningsfullt efter 1(b) –Fler betingelser, fler personer

Progress & todo per WP WP1: Application development –Progress: Existerande DICO-system Applikationer bestämda –GU+Volvos prioritering: (1) navigering, (2) mp3 player –Telia/KTHs prioritering: (1) Chat, (2) Biljettbokning GoDiS installerat hos Telia (GU, Telia) Arkitektur för chatapplikation specad (KTH, Telia) Preliminära versioner av mp3, chat Påbörjat prompt design (Jessica, Anders) –Todo: Prompt design (Jessica, Anders): moves -> strings för 2 betingelser (senare 4) Utreda alternativ för förbättrad syntes/Inspelat tal/domänsyntes (Anders, Alex, David); –Göra det själva »Inspelning »Uppmärkning, aligna »Dialogdrag -> ljudfiler »Bygga GoDiS-modul –Köpa in tjänst (ngn annan gör inspelning, uppmärkning) –Skippa, skaffa bättre syntes »Kräver genereringsgrammatik/lexikon –Kör med nuvarande syntes »Kräver genereringsgrammatik/lexikon Plan för DICO-generationer (GU) –Mall för applikationsspecifikation (GU) –Speca alla applikationer enligt mall Börja implementera applikationerna; preliminära versioner av 2 applikationer (mp3, chat?) till klinik 2 –Slutmål (förslag): ALT: Alla 4 applikationer integrerade i ett demosystem ALT: Separata demos för olika funktionaliteter (t ex taligenkänning i bullrig miljö) Forsatt diskussion senare! Gula fordon, yrkesförartillämpningar har hamnat i bakgrunden Hitta kontaktytor ASR-WPs – resten av WPs Alla partners presenterar önskade (hyfsat realistiska) slutresultat

WP2: User testing and evaluation –Progress: Existerande utvärdering av DICO i simulator (Jessicas exjobb) Exploratory/Visionary data collection –Telia/KTH: telefon –VTEC: försöksledare i bilen –GU: telefon, navigering Inspelningssetup (KTH, Telia) Planering inför klinik 1 (alla) Prompt design (Telia, GU) –Todo Klinik 1(a) v. 13 –Inspelningssetup Klinik 1(b) v. ? –GoDiS-fixar för inspelat tal –Slutföra prompt design –Bättre syntes (ev. inspelat tal/domänsyntes) –Ordna testpersoner och bilar Transkribering och (kvalitativ) analys

WP3: Tools for rapid prototyping and evaluation –WP3.1 Tools for rapid prototyping –WP3.2 Tools for evalutation –WP3.3 - Speech modeling tools for rapid application development –Progress: WP3.1 Tools for rapid prototyping –Fortsatt arbete på GF och ontologibaserad applikationsutveckling (GU) WP3.2 Tools for evalutation –Erfarenhet från explorativa tester –Inspelningssetup WP3.3 - Speech modeling tools for rapid application development –Todo: WP3.1 –Mp3-spelare byggd m h a OWL, GF (exjobbare) WP3.2 –Förbättrad loggning & timestamping för GoDiS (GU) –Synkning av logg + A/V-inspelning (off the shelf?) –Visualisering av inspelat material –WOZ-agent (Telia) –Transkriberingsverktyg (off the shelf) –Analysmetoder »Transkriptionsanalys –Setup för mätning av kognitiv belastning (lane-change task) (Cars?) »Iteration 3,4

WP4: Multimodality –WP4.1. Develop a context- and situation-adaptive dialogue component for modality alternation and combination. –WP4.2. Integrate the vehicle- and simulator-specific graphical software with the spoken and multimodal dialogue manager –WP4.3. Develop in-vehicle graphical interface components. –Progress: WP4.2, 43: Påbörjat uteckling av ny komponent för grafisk menyinteraktion (VTEC + GU) WP5: In-vehicle speech technology –Todo: Prompt design & recording (?) ”Unit selection”-syntes Koppla KTHs ASR till GoDiS (?) ASR-utveckling

WP6: Adapting GoDiS to in-vehicle domain, GoDiS infrastructure –WP6.1 Adapting the dialog to include workload management –WP6.2 Implement GoDIS in test vehicle –WP6.3 Investigate pre-requisites for embedding GoDis into the vehicle architecture –Progress: WP6.?: –application switching (TALK) –Limited inference (TALK) –Todo: WP6.1: Plan för GoDiS-uteckling (GU) –Hantera avbrott & återupptagning –Tidsfaktoranalys, snabba upp system –? context dependent help, elaborate confirmations –? Intelligent recognition (KTH, GU) »kanske i enskild applikation »Reranking; flera språkmodeller, … WP6.2: Komponent (OAA-agent) som routar UDP-signalen (ethernet) till GoDiS, inkl. PTT-signal (VTEC, GU) WP6.3: rapport; behöver diskuteras mer; hitta rätt person WP7: Noise-robust solutions for in-vehicle ASR –I samband med att få in GoDiS i lastbil –Ev. Fristående demo –Definiera showcase –Kolla intresse (Cars) –Kolla intresse hos CE (Construction Equipment) (Johan) WP8: Demo & final report –Att diskutera