[論文読み]Recognizing emotions from speech using a physical model

論文

概要

自然な会話のできるロボットの構築を目指してユーザー発話の音響情報からユーザーの感情を推定刷る研究

対話の中からユーザーに感情アノテーションをしてもらい、推定器を用いて推定

分類する感情はPassiveNegative、ActiveNegative、ActivePositive、PassivePositiveの4種類

特徴量はopenSMILE IS10をPCAで次元削減したものと物理的な現象をシミュレートしたものを使用して比較

2つの特徴量を組み合わせてF値0.564

知見

  • 感情モデリングの手法として、Russell’s circumplex model of affect(感情円環モデル)がある
    • PassiveNegative、ActiveNegative、ActivePositive、PassivePositiveの4種類に分類するとのこと
    • [1]J. A. Russell, ‘‘A circumplex model of affect,’’ J. Pers. Soc.Psychol., pp. 1161–1178 (1980).
  • 音声を使用した感情認識はpitchを用いる手法が主流
    • [2]T. Ba¨nziger and K. R. Scherer, ‘‘The role of intonation in emotional expression,’’ Speech Commun., 46, 252–267 (2005).
    • [3]F. Yu, E. Chang, Y. Xu and H. Shum, ‘‘Emotion detection from speech to enrich multimedia content,’’ Lecture Notes in Computer Science, Vol. 2195, pp. 550–557 (2001).
  • MFCCとLPCCを用いた感情認識手法もある

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください