研究内容

Main Page >> 研究内容

対話の時間的構造に着目した聞き上手な留守番電話の設計

発話を引き出すための対話の時間的構造

対話システムがユーザに対して適切な情報提示を行うためには,ユーザが置かれている状況(問題点,要求,心的状態など)を把握・共有することが不可欠である.そのためには,ユーザの発話を促し,その発話情報(言語,非言語情報)を利用することが重要となるが,従来の対話システムでは,はじめからユーザの側に「話をしたい」という強いモチベーションがあることが前提となっており,しばしばユーザの発話を十分引き出すことができないという問題がある.

では,相手の発話を引き出すような聞き上手な対話とはどのようなものであろうか.カウンセリングも含めた人間同士の対話を観察すると,相手の発話を自然に促すような聞き手は,例えば対話の序盤では積極的に発話(質問など)をして場の雰囲気を作り,中盤では自分の発話を抑えながら相手の発話に対する理解・同調を行い,終盤では話をまとめるといった,明確な時間的構造と,それぞれのフェーズでのプロトコルが存在することが分かる.

聞き上手な留守番電話

そこで本研究では,聞き上手な対話システムの設計には,このような対話構造を積極的に利用することが重要であるという仮説に基づき,しばしばユーザが利用をためらう留守番電話を具体的状況として設定した.留守番電話システムにおいて設計した対話構造を図1に示す.このうち,特に「導入部」および「メッセージ入力部」に注目し,導入部ではシステム側がユーザに対して質問などの発話を行うことで,ユーザのシステムに対する話し方を「独話」から「対話」のモードへと移行させ,「メッセージ入力部」ではシステム側がユーザの発話に対して適切な相槌を行うことで「対話」モードを維持させる.

このような設計により,留守番電話を利用する際のメッセージの残しやすさがどの程度改善できるかについて被験者実験を行った結果を図2に示す.従来研究では,留守番電話に相槌を入れることで不自然さが増すという知見があるが,導入部を設けるとともにメッセージ部で相槌を入れることにより,いずれも用いない場合に対して「メッセージの残しやすさ」に対するスコアが改善されることを確認した.一方で,導入部のみでもメッセージの残しやすさは高い評価となっており,これに相槌を入れると,有意ではないもののスコアがやや低下する.実験におけるアンケートでは,相槌によって違和感を感じる箇所もあるという感想があり,これは今回用いた相槌が,応答音声を固定した単調なものであることが原因と考えられる.発話タイミングは発話内容に大きく依存するという知見が得られているため,応答音声の選択および応答タイミングの制御を行うことで,これらの点が改善されると考えられる.

flow

図1. 留守電応答における対話の流れ

result

図2. メッセージの残しやすさに関する評価結果
(6段階.それぞれ全被験者の平均値)


参考文献

  1. 小島敬, 川嶋宏彰, 平山高嗣, 松山隆司, "対話の時間構造に着目した聞き上手な留守番電話の設計", 人工知能学会 言語・音声理解と対話処理研究会, Vol.2009-SLUD-A901, pp.7-12, 2009.
  2. 小島敬, 川嶋宏彰, 松山隆司, "情報爆発時代におけるヒューマンコミュニケーション —聞き上手な対話システムの実現に向けて—", 情報処理学会 第70回全国大会, pp.5-265--5-266, 2008.3.
  3. [PDF] 小島敬, 川嶋宏彰, 松山隆司, "他者理解を伴う発話における間合いの解析", ヒューマンインタフェースシンポジウム, pp.635-638, 2007.