複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
基本信息
- 批准号:16016250
- 负责人:
- 金额:$ 5.95万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas
- 财政年份:2004
- 资助国家:日本
- 起止时间:2004 至 2005
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
人間と共生する機械を実現するためには、システムがユーザのモデルを知覚し、それに応じて適応的に行動することが重要であると考えられる。本研究ではまず、音声対話によるインタフェースにおいて、協調的な応答を生成するためのユーザモデルについて検討を進めてきた。具体的には、システムに対する習熟度、タスクドメインに関する知識レベル、性急度の3つのユーザモデルを導入し、それに応じて対話制御を行う戦略を提案した。京都市バス運行情報案内システム(現在試験運用中:075-326-3116)において実装・評価を行った結果、各ユーザに適応した協調的応答が、習熟したユーザに対する対話時間を増加させることなく、初心者に対して適切なガイダンスとなることが示された。本研究で用いているユーザモデルは自動判別を行うが、そのための特徴として音声認識結果に含まれる意味情報以外に、発話間間隔やバージインの有無などの音声対話特有の特徴も用いている。特に、習熟度と性急度の学習・判別に用いる特徴はドメイン知識に依存していないため、これらのユーザデルは他のドメインにも応用できる汎用的なものである。ただし、対話制御については人手で規則を記述する必要があり、大規模なドメインやモデルへの適用が困難であった。そこで次に、ユーザや状況のモデルに基づいて、プランニングにより対話制御・応答生成を行う枠組みを考え、このプランニング(プランを動的に選択する機構)を機械学習により行うことを研究した。プランはドメインプランと発話プランの2階層からなり、ドメインプランを決定することで次に提供する情報内容を決定し、発話プランを決定して具体的な応答を生成する。これらのプランは、前記のようなユーザ・状況のモデルをパラメータとする線形の評価関数で規定される。ロールプレイ形式で行う模擬対話サンプルによりこの学習を行うことにより、ユーザに適応した対話プランの選択を実現することができた。
Human と symbiotic す る mechanical を be presently す る た め に は, シ ス テ ム が ユ ー ザ の モ デ ル を know 覚 し, そ れ に 応 じ て optimum 応 に action す る こ と が important で あ る と exam え ら れ る. This study で は ま ず, sounds of words に seaborne よ る イ ン タ フ ェ ー ス に お い て, coordination of な 応 answer を generated す る た め の ユ ー ザ モ デ ル に つ い て beg を 検 into め て き た. Specific に は, シ ス テ ム に す seaborne る acquisition, タ ス ク ド メ イ ン に masato す る knowledge レ ベ ル, impatient の 3 つ の ユ ー ザ モ デ ル を import し, そ れ に 応 じ て words suppression seaborne を line う 戦 slightly を proposal し た. Beijing urban バ ス running situation report within シ ス テ ム (now in the test using: 075-326-3116) に お い て be loaded, review 価 を line っ た results, various ユ ー ザ に optimum 応 し た coordinated 応 answer が, acquisition of し た ユ ー ザ に す seaborne る words time を raised seaborne plus さ せ る こ と な く, beginner's mind に し seaborne て appropriate な ガ イ ダ ン ス と な る こ と が shown さ れ た . This research で い て い る ユ ー ザ モ デ ル は automatic line discriminant を う が, そ の た め の, 徴 と し て に sounds know results contain ま れ る mean intelligence に, interval between 発 words や バ ー ジ イ ン の presence of な ど の sounds words unique の 徴 especially seaborne も with い て い る. に, acquisition of acute と degrees, discriminant に の study with い る, 徴 は ド メ イ ン knowledge に dependent し て い な い た め, こ れ ら の ユ ー ザ デ ル は he の ド メ イ ン に も 応 with で き る of universal な も の で あ る. た だ し, moral suppression に つ い て は manpower で rules を account す る necessary が あ り, large-scale な ド メ イ ン や モ デ ル へ の applicable が difficult で あ っ た. そ こ で に, ユ ー ザ や condition の モ デ ル に base づ い て, プ ラ ン ニ ン グ に よ り words system, the royal 応 seaborne answer generated line を う 枠 group み を え test, こ の プ ラ ン ニ ン グ (プ ラ ン を moving に sentaku す る) を rote learning に よ り line う こ と を research し た. プ ラ ン は ド メ イ ン プ ラ ン と 発 words プ ラ ン の 2 class か ら な り, ド メ イ ン プ ラ ン を decided す る こ と に で times provide す る intelligence content を decided し, 発 プ ラ ン を decided し て specific な 応 answer を generated す る. こ れ ら の プ ラ ン は, former record の よ う な ユ ー ザ · condition の モ デ ル を パ ラ メ ー タ と す る linear の review 価 masato number さ で regulation れ る. Line ロ ー ル プ レ イ form で う simulation words サ seaborne ン プ ル に よ り こ の line learning を う こ と に よ り, ユ ー ザ に optimum 応 し た words プ seaborne ラ ン の sentaku を be presently す る こ と が で き た.
项目成果
期刊论文数量(28)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Automatic indexing of lecture presentations using unsupervised learning of presumed discourse markers
- DOI:10.1109/tsa.2004.828701
- 发表时间:2004-06
- 期刊:
- 影响因子:0
- 作者:Tatsuya Kawahara;Masahiro Hasegawa;Kazuya Shitaoka;T. Kitade;H. Nanjo
- 通讯作者:Tatsuya Kawahara;Masahiro Hasegawa;Kazuya Shitaoka;T. Kitade;H. Nanjo
Example-based training of dialogue planning incorporating user and situation models
结合用户和情境模型的基于示例的对话规划训练
- DOI:
- 发表时间:2004
- 期刊:
- 影响因子:0
- 作者:S.Ueno;I.R.Lane;T.Kawahara
- 通讯作者:T.Kawahara
Trigger-based language model adaptation for automatic transcription of panel discussions.
基于触发器的语言模型自适应,用于自动转录小组讨论。
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:C.Troncoso;T.Kawahara
- 通讯作者:T.Kawahara
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
河原 達也其他文献
京都市バス運行情報案内システムにおける実ユーザのふるまいの分析
京都市公交车运营信息引导系统的实际用户行为分析
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
駒谷 和範;河原 達也;奥乃 博 - 通讯作者:
奥乃 博
多様な相槌をうつ傾聴対話システムのための相槌形態の予測
支持多种宜人内容的听力对话系统的宜人形式预测
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
山口 貴史;井上 昂治;吉野 幸一郎;高梨 克也;Nigel G. Ward;河原 達也 - 通讯作者:
河原 達也
原子核をプローブとした地球核周辺の局所構造探査
使用原子核作为探测器探索地核周围的局部结构
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
坂東 宜昭;糸山 克寿;昆陽 雅司;田所 諭;中臺 一博;吉井 和佳;河原 達也;奥乃 博;三井隆也 - 通讯作者:
三井隆也
モバイルMRシステム構築のための機能分散型フレームワーク(8)-アニメーションの表現力向上-
构建移动MR系统的功能分布式框架(8)-提高动画表现力-
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
平山 高嗣;角 康之;河原 達也;松山隆司;加藤芳秀,松原茂樹;川端大輔,木村朝子,柴田史久 - 通讯作者:
川端大輔,木村朝子,柴田史久
河原 達也的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('河原 達也', 18)}}的其他基金
End-to-End Model for Task-Independent Speech Understanding and Dialogue
与任务无关的语音理解和对话的端到端模型
- 批准号:
20H00602 - 财政年份:2020
- 资助金额:
$ 5.95万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
仮想空間のチームスポーツを介したコミュニケーションスキルの知的学習支援
通过虚拟空间中的团队运动来智能学习支持沟通技巧
- 批准号:
15F15049 - 财政年份:2015
- 资助金额:
$ 5.95万 - 项目类别:
Grant-in-Aid for JSPS Fellows
強化学習に基づく適応的な音声対話システム
基于强化学习的自适应口语对话系统
- 批准号:
10F00050 - 财政年份:2010
- 资助金额:
$ 5.95万 - 项目类别:
Grant-in-Aid for JSPS Fellows
用例に基づく対話制御を用いたコンピュータ支援型言語学習システム
使用基于示例的对话控制的计算机辅助语言学习系统
- 批准号:
10F00361 - 财政年份:2010
- 资助金额:
$ 5.95万 - 项目类别:
Grant-in-Aid for JSPS Fellows
ユーザ・状況に適応的な音声対話による大規模情報の検索・提示
通过适应用户和情况的语音对话搜索和呈现大规模信息
- 批准号:
19024044 - 财政年份:2007
- 资助金额:
$ 5.95万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
ユーザ・状況に適応的な音声対話による大規模情報の検索・提示
通过适应用户和情况的语音对话搜索和呈现大规模信息
- 批准号:
18049047 - 财政年份:2006
- 资助金额:
$ 5.95万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
- 批准号:
15017252 - 财政年份:2003
- 资助金额:
$ 5.95万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
- 批准号:
14019052 - 财政年份:2002
- 资助金额:
$ 5.95万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
- 批准号:
13224057 - 财政年份:2001
- 资助金额:
$ 5.95万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas (C)
キーフレーズ認識とその信頼度計算に基づく柔軟な音声対話理解
基于关键词识别的灵活语音对话理解及其可靠性计算
- 批准号:
09780328 - 财政年份:1997
- 资助金额:
$ 5.95万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
脳神経疾患による構音障害を克服するための,音声認識および音声合成AIシステムの開発
开发语音识别与语音合成AI系统,克服脑神经疾病引起的构音障碍
- 批准号:
24K10630 - 财政年份:2024
- 资助金额:
$ 5.95万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
画像認識と音声認識の複合AIによる災害状況認識ユニットの基礎研究
图像识别与语音识别相结合的AI灾情识别单元基础研究
- 批准号:
23K23017 - 财政年份:2024
- 资助金额:
$ 5.95万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
画像・音声認識と料理データベースによる食事記録システム開発、及び疫学研究での応用
基于图像/语音识别和烹饪数据库的用餐记录系统的开发及其在流行病学研究中的应用
- 批准号:
23K20170 - 财政年份:2024
- 资助金额:
$ 5.95万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
非母語話者のスマートフォン音声認識機能での誤認識傾向を考慮した発音学習システム
使用智能手机语音识别功能,考虑到非母语人士的误识别倾向的发音学习系统。
- 批准号:
24K06231 - 财政年份:2024
- 资助金额:
$ 5.95万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
自動音声認識を利用したbilingual speech-to-textシステム構築と授業分析への応用
自动语音识别双语语音转文本系统的构建及其在课程分析中的应用
- 批准号:
24K04125 - 财政年份:2024
- 资助金额:
$ 5.95万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
実用性の高いEnd-to-End音声認識に向けた研究
高实用性端到端语音识别研究
- 批准号:
22KJ2898 - 财政年份:2023
- 资助金额:
$ 5.95万 - 项目类别:
Grant-in-Aid for JSPS Fellows
音声認識のデータ拡張のための音声合成との密統合
与语音合成紧密集成,用于语音识别的数据增强
- 批准号:
23K16944 - 财政年份:2023
- 资助金额:
$ 5.95万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
画像認識と音声認識の複合AIによる災害状況認識ユニットの基礎研究
图像识别与语音识别相结合的AI灾情识别单元基础研究
- 批准号:
22H01749 - 财政年份:2022
- 资助金额:
$ 5.95万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
日常生活音を活用した構音障害者のための音響監視および音声認識システムの研究
使用日常声音对构音障碍患者进行声学监测和语音识别系统的研究
- 批准号:
22K12168 - 财政年份:2022
- 资助金额:
$ 5.95万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
自動音声認識と機械学習による新たな医学教育システムの創出
使用自动语音识别和机器学习创建新的医学教育系统
- 批准号:
22K10459 - 财政年份:2022
- 资助金额:
$ 5.95万 - 项目类别:
Grant-in-Aid for Scientific Research (C)