複数話者の音声コミュニケーションの意図・状況理解

了解多说话者语音通信的意图和情况

基本信息

  • 批准号:
    15017252
  • 负责人:
  • 金额:
    $ 3.26万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
  • 财政年份:
    2003
  • 资助国家:
    日本
  • 起止时间:
    2003 至 无数据
  • 项目状态:
    已结题

项目摘要

人間と共生する機械を実現するためには、システムがユーザのモデルを知覚し、それに応じて適応的に行動することが重要であると考えられる。本研究では、音声対話によるインタフェースにおいて、協調的な応答を生成するためのユーザモデルについて検討を進めてきた。具体的には、システムに対する習熟度、タスクドメインに関する知識レベル、性急度の3つのユーザモデルを導入し、それに応じて対話制御を行う戦略を提案した。京都市バス運行情報案内システム(現在試験運用中:075-326-3116)において実装・評価を行った結果、各ユーザに適応した協調的応答が、習熟したユーザに対する対話時間を増加させることなく、初心者に対して適切なガイダンスとなることが示された。本研究で用いているユーザモデルの判別には、音声認識結果に含まれる意味情報以外に、発話間間隔やバージインの有無などの音声対話特有の特徴も用いている。特に、習熟度と性急度の学習・判別に用いる特徴はドメイン知識に依存していないため、これらのユーザモデルは他のドメインにも応用できる汎用的なものである。これらの研究成果に関しては、自然言語処理の分野で最も権域があるAssociation for Computational Linguistics (ACL)において発表論文として採択され、人工知能学会全国大会においても優秀賞を授与された。さらに、国内外の雑誌論文に掲載される予定である。また、新聞での報道もされた。
Human と symbiotic す る mechanical を be presently す る た め に は, シ ス テ ム が ユ ー ザ の モ デ ル を know 覚 し, そ れ に 応 じ て optimum 応 に action す る こ と が important で あ る と exam え ら れ る. This study で は, sounds of words に seaborne よ る イ ン タ フ ェ ー ス に お い て, coordination of な 応 answer を generated す る た め の ユ ー ザ モ デ ル に つ い て beg を 検 into め て き た. Specific に は, シ ス テ ム に す seaborne る acquisition, タ ス ク ド メ イ ン に masato す る knowledge レ ベ ル, impatient の 3 つ の ユ ー ザ モ デ ル を import し, そ れ に 応 じ て words suppression seaborne を line う 戦 slightly を proposal し た. Beijing urban バ ス running situation report within シ ス テ ム (now in the test using: 075-326-3116) に お い て be loaded, review 価 を line っ た results, various ユ ー ザ に optimum 応 し た coordinated 応 answer が, acquisition of し た ユ ー ザ に す seaborne る words time を raised seaborne plus さ せ る こ と な く, beginner's mind に し seaborne て appropriate な ガ イ ダ ン ス と な る こ と が shown さ れ た . This research で い て い る ユ ー ザ モ デ ル の discriminant に は, sounds know results に ま れ る mean intelligence に, interval between 発 words や バ ー ジ イ ン の presence of な ど の sounds words unique の 徴 especially seaborne も with い て い る. に, acquisition of acute と degrees, discriminant に の study with い る, 徴 は ド メ イ ン knowledge に dependent し て い な い た め, こ れ ら の ユ ー ザ モ デ ル は he の ド メ イ ン に も 応 with で き る of universal な も の で あ る. こ れ ら の research に masato し て は, natural speech 処 の eset で most も 権 domain が あ る Association for Computational Linguistics (ACL) に お い て 発 table paper と し て mining 択 さ れ, artificial knowledge can learn national convention に お い て も excellent reward を grant さ れ た. Youdaoplaceholder0, domestic and foreign さらに 雑 journal papers に published される approved である. Youdaoplaceholder0, news で で report また された.

项目成果

期刊论文数量(12)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
山肩洋子, 河原達也, 奥乃博, 美濃導彦: "音声対話システムにおける物体指示のための信念ネットワークを用いた曖昧性の解消"人工知能学会誌. Vol.19, No.1. 47-56 (2004)
Yoko Yamashita、Tatsuya Kawahara、Hiroshi Okuno、Norihiko Mino:“在口语对话系统中使用信念网络消除歧义”,日本人工智能学会杂志,第 19 卷,第 47-56 期(2004 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
T.Kawahara, M.Hasegawa, K.Shitaoka, T.Kitade, H.Nanjo.: "Automatic indexing of lecture presentation using unsupervised learning of presumed discourse markers."IEEE Trans.Speech & Audio Processing. (採録決定). (2004)
T.Kawahara、M.Hasekawa、K.Shitaoka、T.Kitade、H.Nanjo.:“使用假定话语标记的无监督学习自动索引讲座演示。”IEEE Trans.Speech & Audio Processing(已接受)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
南條浩輝, 河原達也: "講演音声認識のための教師なし言語モデル適応と発話速度に適応したデコーディング"電子情報通信学会論文誌. (採録決定). (2004)
Hiroki Nanjo、Tatsuya Kawahara:“适用于演讲语音识别和解码的无监督语言模型适应语速”电子、信息和通信工程师学会汇刊(2004 年已接受)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
秋田祐哉, 河原達也: "多数話者モデルを用いた討論音声の教師なし話者インデキシング"電子情報通信学会論文誌. Vol.J87-DII, No.2. 495-503 (2004)
Yuya Akita、Tatsuya Kawahara:“使用多发言者模型对讨论演讲进行无监督的发言者索引”,电子、信息和通信工程师学会汇刊,第 J87-DII 卷,第 2 期(2004 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
K.Komatani, S.Ueno, T.Kawahara, H.G.Okuno: "Flexible guidance generation using user model in spoken dialogue systems."In Proc.Annual Meeting of Association for Computational Linguistics (ACL). 256-263 (2003)
K.Komatani、S.Ueno、T.Kawahara、H.G.Okuno:“在口语对话系统中使用用户模型进行灵活的指导生成。”在 Proc.计算语言学协会 (ACL) 年会中。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

河原 達也其他文献

京都市バス運行情報案内システムにおける実ユーザのふるまいの分析
京都市公交车运营信息引导系统的实际用户行为分析
多様な相槌をうつ傾聴対話システムのための相槌形態の予測
支持多种宜人内容的听力对话系统的宜人形式预测
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山口 貴史;井上 昂治;吉野 幸一郎;高梨 克也;Nigel G. Ward;河原 達也
  • 通讯作者:
    河原 達也
音声対話システムにおけるユーザのふるまいの経時的変化の分析
分析语音对话系统中用户行为随时间的变化
モバイルMRシステム構築のための機能分散型フレームワーク(8)-アニメーションの表現力向上-
构建移动MR系统的功能分布式框架(8)-提高动画表现力-
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    平山 高嗣;角 康之;河原 達也;松山隆司;加藤芳秀,松原茂樹;川端大輔,木村朝子,柴田史久
  • 通讯作者:
    川端大輔,木村朝子,柴田史久
原子核をプローブとした地球核周辺の局所構造探査
使用原子核作为探测器探索地核周围的局部结构
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    坂東 宜昭;糸山 克寿;昆陽 雅司;田所 諭;中臺 一博;吉井 和佳;河原 達也;奥乃 博;三井隆也
  • 通讯作者:
    三井隆也

河原 達也的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('河原 達也', 18)}}的其他基金

End-to-End Model for Task-Independent Speech Understanding and Dialogue
与任务无关的语音理解和对话的端到端模型
  • 批准号:
    20H00602
  • 财政年份:
    2020
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
仮想空間のチームスポーツを介したコミュニケーションスキルの知的学習支援
通过虚拟空间中的团队运动来智能学习支持沟通技巧
  • 批准号:
    15F15049
  • 财政年份:
    2015
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
強化学習に基づく適応的な音声対話システム
基于强化学习的自适应口语对话系统
  • 批准号:
    10F00050
  • 财政年份:
    2010
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
用例に基づく対話制御を用いたコンピュータ支援型言語学習システム
使用基于示例的对话控制的计算机辅助语言学习系统
  • 批准号:
    10F00361
  • 财政年份:
    2010
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
ユーザ・状況に適応的な音声対話による大規模情報の検索・提示
通过适应用户和情况的语音对话搜索和呈现大规模信息
  • 批准号:
    19024044
  • 财政年份:
    2007
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
ユーザ・状況に適応的な音声対話による大規模情報の検索・提示
通过适应用户和情况的语音对话搜索和呈现大规模信息
  • 批准号:
    18049047
  • 财政年份:
    2006
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
  • 批准号:
    16016250
  • 财政年份:
    2004
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
  • 批准号:
    14019052
  • 财政年份:
    2002
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
  • 批准号:
    13224057
  • 财政年份:
    2001
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (C)
キーフレーズ認識とその信頼度計算に基づく柔軟な音声対話理解
基于关键词识别的灵活语音对话理解及其可靠性计算
  • 批准号:
    09780328
  • 财政年份:
    1997
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

脳神経疾患による構音障害を克服するための,音声認識および音声合成AIシステムの開発
开发语音识别与语音合成AI系统,克服脑神经疾病引起的构音障碍
  • 批准号:
    24K10630
  • 财政年份:
    2024
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
画像認識と音声認識の複合AIによる災害状況認識ユニットの基礎研究
图像识别与语音识别相结合的AI灾情识别单元基础研究
  • 批准号:
    23K23017
  • 财政年份:
    2024
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
非母語話者のスマートフォン音声認識機能での誤認識傾向を考慮した発音学習システム
使用智能手机语音识别功能,考虑到非母语人士的误识别倾向的发音学习系统。
  • 批准号:
    24K06231
  • 财政年份:
    2024
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
画像・音声認識と料理データベースによる食事記録システム開発、及び疫学研究での応用
基于图像/语音识别和烹饪数据库的用餐记录系统的开发及其在流行病学研究中的应用
  • 批准号:
    23K20170
  • 财政年份:
    2024
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
自動音声認識を利用したbilingual speech-to-textシステム構築と授業分析への応用
自动语音识别双语语音转文本系统的构建及其在课程分析中的应用
  • 批准号:
    24K04125
  • 财政年份:
    2024
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
実用性の高いEnd-to-End音声認識に向けた研究
高实用性端到端语音识别研究
  • 批准号:
    22KJ2898
  • 财政年份:
    2023
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
音声認識のデータ拡張のための音声合成との密統合
与语音合成紧密集成,用于语音识别的数据增强
  • 批准号:
    23K16944
  • 财政年份:
    2023
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
画像認識と音声認識の複合AIによる災害状況認識ユニットの基礎研究
图像识别与语音识别相结合的AI灾情识别单元基础研究
  • 批准号:
    22H01749
  • 财政年份:
    2022
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
日常生活音を活用した構音障害者のための音響監視および音声認識システムの研究
使用日常声音对构音障碍患者进行声学监测和语音识别系统的研究
  • 批准号:
    22K12168
  • 财政年份:
    2022
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
自動音声認識と機械学習による新たな医学教育システムの創出
使用自动语音识别和机器学习创建新的医学教育系统
  • 批准号:
    22K10459
  • 财政年份:
    2022
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了