This page in English

Forskningsprojekt Samtalets prosodi

Syftet med projektet var att fördjupa kunskapen om de prosodiska fenomen som är specifika för samtal. Detta är ett led i ett större arbete vars mål är att skapa en artificiell samtalspartner.

This page in English

Kontaktperson på SU

Mattias Heldner

Professor

Institutionen för lingvistik

08-16 19 88

mattias.heldner@ling.su.se

Översikt

Projektperiod

2010-01-01 - 2012-12-31

Ansvarig

Institutionen för lingvistik

Medverkande

Avdelningen för tal, musik och hörsel

Forskningsämne

Fonetik

Status

Avslutad

Finansiering

Riksbankens Jubileumsfond

Mer information

Länkar

Samtalets prosodi (speech.kth.se)

Mostphotos

Äldre talsyntes låter inte som om den deltar i ett samtal, och dagens talteknologi är bristfällig när det kommer till att tolka mänskligt samtalsbeteende. Syftet med detta projekt var därför att fördjupa kunskapen om de prosodiska fenomen som är specifika för samtal och som har en interaktionell funktion, med det långsiktiga målet att kunna bidra till skapandet av en arificiell samtalspartner.

Projektbeskrivning

Huvudspåret inom projektet handlade om att undersöka och modellera rytmiska mönster och intonationsmönster i samband med turtagning och verbal återkoppling i olika svensk- och engelskspråkiga taldatabaser. Projektet har även arbetat med att verifiera effekter av observerade prosodiska egenskaper genom olika lyssnings- och
produktionstester, samt genom generering av interaktivt beteende i människa-robot interaktion.

Tre viktiga resultat

De tre viktigaste resultaten inom projektet kan föras in under följande punkter:

Kvantitativa beskrivningar av samtalets prosodi
Det handlar om tajming av återkopplingsljud, ’backchannels’, i förhållande till samtalspartens tal, prosodiska mönster som inbjuder till återkopplingsljud, hur ofta det finns möjlighet att yttra dem, prosodisk realisering av återkopplingssignaler och hur dessa yttranden är anpassade till samtalspartens prosodi.
Stokastiska modeller av turtagning i interaktion utifrån prosodiska egenskaper, exempelvis tal, tystnader, överlapp, talhastighetsförändringar, intonationsmönster, ljudstyrkemönster som ger ramverket för en artificiell talare att förstå och producera mer människolikt samtalsbeteende
Implementering av prosodiskt beteende i en fysisk realisering av en avatar för verifiering av effekter av samtalsspecifika prosodiska egenskaper.

Dessa tre punkter bidrar tillsammans till att forskningen tar ett stort steg framåt mot det långsiktiga målet att skapa en artificiell samtalspartner som låter och beter sig som om den deltar i ett samtal.

Projektmedlemmar

Projektansvariga

Mattias Heldner

Professor

Institutionen för lingvistik

08-16 19 88

mattias.heldner@ling.su.se

Medlemmar

Kornel Laskowski

Lärare

Institutionen för lingvistik

kornel.laskowski@ling.su.se

Jens Edlund

Universitetslektor

Avdelningen för tal, musik och hörsel, KTH

edlund@speech.kth.se

Anna Hjalmarsson

Forskare

Avdelningen för tal, musik och hörsel, KTH

annah@speech.kth.se

Publikationer

Heldner, Hjalmarsson & Edlund (2013).

Backchannel relevance spaces. In E. L. Asu & P. Lippus (Eds.), Nordic Prosody: Proceedings of the XIth Conference, Tartu 2012 (pp. 137-146), Frankfurt am Main: Peter Lang, Germany.

Laskowski, Edlund & Heldner (2011b)

A single-port non-parametric model of turn-taking in multi-party conversation. In Proceedings ICASSP 2011 (pp. 5600-5603), Prague, Czech Republic.

Publikationslista

Samtalets prosodi: Fullständig publikationslista