研究内容

Main Page >> 研究内容

博士論文概要

Interval-Based Hybrid Dynamical System for Modeling Dynamic Events and Structures

(邦題)動的事象と構造のモデル化のための時区間ハイブリッドダイナミカルシステム

本論文では,顔の表情変化やジェスチャ認識,音声対話といったヒューマンインタフェイスへの応用を目的とし,時系列信号におけるダイナミクスの変化や,複数の時系列信号間の時間的構造(同期パターンや相互依存関係)を記述・認識・生成するための新たな計算モデルとして,Interval-Based Hybrid Dynamical System(IHDS, 時区間ハイブリッドダイナミカルシステム)を提案した.これは,物理的現象記述に適した力学系モデル(計量空間における連続的な状態遷移を記述する微分方程式系)と,人間の心的・知的活動の記述に適した離散事象系モデル(順序集合上での離散的状態遷移を記述する記憶書き換え系)を,時区間に基づいて統合したモデルである.

実世界における連続的変化を表現するには力学系が適しているが,複雑な構造を扱うには適してない.一方で,「口を広げた後に発話する」のような,複数の事象間の構造(同期関係や順序関係等)を表現するには離散事象系が適しているが,あらかじめ記述単位(記号)を定義する必要がある.本論文で提案したIHDSは,複数の線形システムと有限状態オートマトンからなり,オートマトンの各離散状態がそれぞれ異なる線形システムに対応している.これにより,入力された観測時系列データが単一の線形システムで表現できる時区間に分節化され,線形システムが活性化された順序をオートマトンによって表現することにより,複雑な構造を持つ動的事象の記述・認識が可能となる(2章).

しかしながら,このようなモデルの問題点として学習の困難さがある.本論文では,学習用に与えられた時系列信号からシステムのパラメタを自動的に推定する方法として,二段階学習法を提案した.第一段階では,線形システムの階層的クラスタリングによって,線形システムの数やパラメタを推定し,第二段階では,EMアルゴリズムによって,オートマトンの状態遷移確率を含めた系全体のパラメタを推定・洗練化する.シミュレーションおよび実画像を用いた実験により,入力時系列信号の分節化とモデルのパラメタ推定とを同時に行うことができることを示した(3章).

次に,提案したモデルを,複数の信号における時間的構造の分析に用いることの有効性を検討した.微妙な表情を生み出す顔の各部位(目,口など)の動きを,IHDSを用いて表現することによって,複雑な運動を単純な運動パターンの時区間に分節化することができ,各部位間の運動開始・終了の時間関係(タイミング構造)を抽出することが可能となる.このタイミング構造を分析することによって,従来は十分に表現できなかった,意図的な笑いと自発的な笑いの判別ができることを,複数の被験者に対する実験によって確認した(4章).

最後に,発話と口の動きなどの,異なるメディア信号間に存在する変化パターンの時間的相互依存性(マルチメディア・タイミング構造)を表現するための計算モデルを構築した.口元の映像と音声信号とを同時計測し,両者の間に存在する相互依存的タイミング構造モデルをあらかじめ学習することで,新たに入力された音声信号からそれと同期した口の動き映像が生成できることを示し,モデルの有効性を実証した(5章).

参考文献