权益分类	功能权益	普通用户	{{item.name}}会员
{{category.name}}	{{benefitItem.name}}

複数話者の音声コミュニケーションの意図・状況理解

了解多说话者语音通信的意图和情况

基本信息

批准号：
16016250
负责人：
河原達也
金额：
$ 5.95万
依托单位：
Kyoto University
依托单位国家：
日本
项目类别：
Grant-in-Aid for Scientific Research on Priority Areas
财政年份：
2004
资助国家：
日本
起止时间：
2004 至 2005
项目状态：
已结题

项目摘要

人間と共生する機械を実現するためには、システムがユーザのモデルを知覚し、それに応じて適応的に行動することが重要であると考えられる。本研究ではまず、音声対話によるインタフェースにおいて、協調的な応答を生成するためのユーザモデルについて検討を進めてきた。具体的には、システムに対する習熟度、タスクドメインに関する知識レベル、性急度の3つのユーザモデルを導入し、それに応じて対話制御を行う戦略を提案した。京都市バス運行情報案内システム(現在試験運用中:075-326-3116)において実装・評価を行った結果、各ユーザに適応した協調的応答が、習熟したユーザに対する対話時間を増加させることなく、初心者に対して適切なガイダンスとなることが示された。本研究で用いているユーザモデルは自動判別を行うが、そのための特徴として音声認識結果に含まれる意味情報以外に、発話間間隔やバージインの有無などの音声対話特有の特徴も用いている。特に、習熟度と性急度の学習・判別に用いる特徴はドメイン知識に依存していないため、これらのユーザデルは他のドメインにも応用できる汎用的なものである。ただし、対話制御については人手で規則を記述する必要があり、大規模なドメインやモデルへの適用が困難であった。そこで次に、ユーザや状況のモデルに基づいて、プランニングにより対話制御・応答生成を行う枠組みを考え、このプランニング(プランを動的に選択する機構)を機械学習により行うことを研究した。プランはドメインプランと発話プランの2階層からなり、ドメインプランを決定することで次に提供する情報内容を決定し、発話プランを決定して具体的な応答を生成する。これらのプランは、前記のようなユーザ・状況のモデルをパラメータとする線形の評価関数で規定される。ロールプレイ形式で行う模擬対話サンプルによりこの学習を行うことにより、ユーザに適応した対話プランの選択を実現することができた。

Human と symbiotic する mechanical を be presently するためには, システムがユーザのモデルを know 覚し, それに応じて optimum 応に action することが important であると exam えられる. This study ではまず, sounds of words に seaborne よるインタフェースにおいて, coordination of な応 answer を generated するためのユーザモデルについて beg を検 into めてきた. Specific には, システムにす seaborne る acquisition, タスクドメインに masato する knowledge レベル, impatient の 3 つのユーザモデルを import し, それに応じて words suppression seaborne を line う戦 slightly を proposal した. Beijing urban バス running situation report within システム (now in the test using: 075-326-3116) において be loaded, review 価を line った results, various ユーザに optimum 応した coordinated 応 answer が, acquisition of したユーザにす seaborne る words time を raised seaborne plus させることなく, beginner's mind にし seaborne て appropriate なガイダンスとなることが shown された . This research でいているユーザモデルは automatic line discriminant をうが, そのための, 徴としてに sounds know results contain まれる mean intelligence に, interval between 発 words やバージインの presence of などの sounds words unique の徴 especially seaborne も with いている. に, acquisition of acute と degrees, discriminant にの study with いる, 徴はドメイン knowledge に dependent していないため, これらのユーザデルは he のドメインにも応 with できる of universal なものである. ただし, moral suppression については manpower で rules を account する necessary があり, large-scale なドメインやモデルへの applicable が difficult であった. そこでに, ユーザや condition のモデルに base づいて, プランニングにより words system, the royal 応 seaborne answer generated line をう枠 group みをえ test, このプランニング (プランを moving に sentaku する) を rote learning により line うことを research した. プランはドメインプランと発 words プランの 2 class からなり, ドメインプランを decided することにで times provide する intelligence content を decided し, 発プランを decided して specific な応 answer を generated する. これらのプランは, former record のようなユーザ · condition のモデルをパラメータとする linear の review 価 masato number さで regulation れる. Line ロールプレイ form でう simulation words サ seaborne ンプルによりこの line learning をうことにより, ユーザに optimum 応した words プ seaborne ランの sentaku を be presently することができた.