[論文読み]発話タグの統計的特性を考慮した対話における適切な発話タイミング

論文

概要

音声対話システムにおいてどのぐらいの応答速度がユーザーにとって良いと感じられるかについて分析。

対話の種類によっても応答速度の良さは変わるようなので対話カテゴリの出現頻度ごとに分類し、各々において良いとされる応答速度を分析

実験

-200ms、0ms、400ms、600ms、800msの応答速度で応答を生成して各対話の応答速度の良さを実験

知見

対話コミュニケーションにおいて、非言語音響情報は対話全体の65%または93%の情報量を持つと言われている

対話コーパスを用いた発話カテゴリごとの出現頻度

小林ら、音声対話システムにおける挨拶発話の適切なタイミング生成,計測自動制御学会論文誌,2015によると600msが最も良い応答速度とのこと。

陳述(Statement)を含む対話の適切な応答速度は400-600ms

相槌を含む対話の適切な応答速度も400-600ms

Yes-No質問を含む対話の適切な応答速度は800ms

5W1H質問を含む対話の適切な応答速度は600ms