強化学習に基づく適応的な音声対話システム

基于强化学习的自适应口语对话系统

基本信息

  • 批准号:
    10F00050
  • 负责人:
  • 金额:
    $ 1.34万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2010
  • 资助国家:
    日本
  • 起止时间:
    2010 至 2012
  • 项目状态:
    已结题

项目摘要

音声は人間同士のコミュニケーションにおいて最も自然なメディアであり、計算機やロボットとのインタラクションにおいても音声対話は重要な役割を果たすと考えられる。しかしながら、実際の環境において、計算機やロボットから一定(数メートル)以上離れた状況で発話がなされると、残響等の影響が顕著となる。その結果、音声認識や発話の理解の性能が大きく低下し、円滑な対話も困難になる。従来この問題に対して、音声強調・残響抑圧の研究が行われてきたが、人間の聴感上の改善を主な目標としていたため、必ずしも音声認識やインタラクションの性能改善につながるとは限らないものであった。これに対して、音声認識やインタラクションの改善に直接的に貢献するように音声強調を行う方法について研究を行った。今年度は特に、複数の分解能からなるウエーブレット分析の手法を研究した。提案するウエーブレットパケット分解では、遅い残響成分と音声の成分を効果的に分離するように、各々の分解能を設定する。これにより、各々に適切なウエーブレット基底を用いることで、観測された残響のある信号から効果的なウイナーゲインを計算することができる。残響抑圧は、ウエーブレットパケットの係数をウイナーゲインでフィルタすることで行われる、大語彙連続音声認識(JNASタスク)の評価実験において、提案手法はウエーブレット分析に基づく従来法や他の残響抑圧手法と比べて、高い性能を示した。
The sound of the human being, the most natural person, the computer personボットとのインタラクションにおいても声対语はimportantなservice cutを Fruitたすと卡えられる.しかしながら、実记の Environment において、Computer やロボットからsure(number of メー(トル) The above-mentioned conditions are not affected by the effects of noise, reverberation, etc.その Result, sound recognition や発语 のperformance が大きくlower し, 円 slippery な対语もdifficulty になる. The problems that come from here, the research on sound emphasis and reverb suppression, the main goal of improving the sense of the world.していたため、必ずしも Sound recognition やインタラクションの performance improvement につながるとはlimited ないものであった.これに対して, sound recognition やインタラクションの Improvement にDirect contribution するように sound emphasis を行うmethodについてStudy を行った. This year's special research is on the decomposition of complex numbers and the analysis techniques of complex numbers. It is proposed to separate the decomposition and reverberation components and the sound components and set the decomposition function for each decomposition effect.これにより, each 々にappropriate なウエーブレットbase を use いることで, 観measurement されなウイナーゲインをcalculation of the reverberation signal から effect. Reverberation suppression pressure, ウエーブレットパケットの coefficient をウイナーゲインでフィルタすることで行われる、大语集连続 Sound recognition (JNASタスク)のreview価実験において、Proposal technique はウエーブレットanalysisにThe basic method is based on the reverberation and pressure suppression technique, and the high performance is demonstrated.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Robust speech recognition in noisy and reverberant conditions using Wiener filtering in the wavelet
使用小波中的维纳滤波在噪声和混响条件下进行鲁棒语音识别
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Randy Gomez;Tatsuya Kawahara
  • 通讯作者:
    Tatsuya Kawahara
Robust speech recognition using optimized wavelet denoising with noise profiles.
使用优化的小波去噪和噪声分布进行鲁棒语音识别。
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Randy Gomez;Tatsuya Kawahara.
  • 通讯作者:
    Tatsuya Kawahara.
Wavelet packet decomposition-based dereverberation for robust asr
基于小波包分解的去混响实现稳健的 ASR
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Randy Gomez;Tatsuya Kawahara
  • 通讯作者:
    Tatsuya Kawahara
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

河原 達也其他文献

京都市バス運行情報案内システムにおける実ユーザのふるまいの分析
京都市公交车运营信息引导系统的实际用户行为分析
多様な相槌をうつ傾聴対話システムのための相槌形態の予測
支持多种宜人内容的听力对话系统的宜人形式预测
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山口 貴史;井上 昂治;吉野 幸一郎;高梨 克也;Nigel G. Ward;河原 達也
  • 通讯作者:
    河原 達也
原子核をプローブとした地球核周辺の局所構造探査
使用原子核作为探测器探索地核周围的局部结构
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    坂東 宜昭;糸山 克寿;昆陽 雅司;田所 諭;中臺 一博;吉井 和佳;河原 達也;奥乃 博;三井隆也
  • 通讯作者:
    三井隆也
音声対話システムにおけるユーザのふるまいの経時的変化の分析
分析语音对话系统中用户行为随时间的变化
モバイルMRシステム構築のための機能分散型フレームワーク(8)-アニメーションの表現力向上-
构建移动MR系统的功能分布式框架(8)-提高动画表现力-
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    平山 高嗣;角 康之;河原 達也;松山隆司;加藤芳秀,松原茂樹;川端大輔,木村朝子,柴田史久
  • 通讯作者:
    川端大輔,木村朝子,柴田史久

河原 達也的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('河原 達也', 18)}}的其他基金

End-to-End Model for Task-Independent Speech Understanding and Dialogue
与任务无关的语音理解和对话的端到端模型
  • 批准号:
    20H00602
  • 财政年份:
    2020
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
仮想空間のチームスポーツを介したコミュニケーションスキルの知的学習支援
通过虚拟空间中的团队运动来智能学习支持沟通技巧
  • 批准号:
    15F15049
  • 财政年份:
    2015
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
用例に基づく対話制御を用いたコンピュータ支援型言語学習システム
使用基于示例的对话控制的计算机辅助语言学习系统
  • 批准号:
    10F00361
  • 财政年份:
    2010
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
ユーザ・状況に適応的な音声対話による大規模情報の検索・提示
通过适应用户和情况的语音对话搜索和呈现大规模信息
  • 批准号:
    19024044
  • 财政年份:
    2007
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
ユーザ・状況に適応的な音声対話による大規模情報の検索・提示
通过适应用户和情况的语音对话搜索和呈现大规模信息
  • 批准号:
    18049047
  • 财政年份:
    2006
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
  • 批准号:
    16016250
  • 财政年份:
    2004
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
  • 批准号:
    15017252
  • 财政年份:
    2003
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
  • 批准号:
    14019052
  • 财政年份:
    2002
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
  • 批准号:
    13224057
  • 财政年份:
    2001
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (C)
キーフレーズ認識とその信頼度計算に基づく柔軟な音声対話理解
基于关键词识别的灵活语音对话理解及其可靠性计算
  • 批准号:
    09780328
  • 财政年份:
    1997
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

セキュアな音声対話のための実環境なりすまし音声コーパス構築
构建真实世界的欺骗语音语料库以实现安全语音对话
  • 批准号:
    24K14993
  • 财政年份:
    2024
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
意図を的確に伝える音声対話翻訳の基盤技術の創出
创造准确传达意图的语音对话翻译基础技术
  • 批准号:
    23K28144
  • 财政年份:
    2024
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
音声対話系の統一的モデリングに基づくユーザへのモデル自動適応
基于口语对话系统统一建模的自动模型适应用户
  • 批准号:
    23K28147
  • 财政年份:
    2024
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
九州・沖縄方言の継承支援に資する音声対話型生成系AIの開発
开发支持九州、冲绳方言传承的语音对话生成系统AI
  • 批准号:
    24K00074
  • 财政年份:
    2024
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
意図を的確に伝える音声対話翻訳の基盤技術の創出
创造准确传达意图的语音对话翻译基础技术
  • 批准号:
    23H03454
  • 财政年份:
    2023
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
音声対話系の統一的モデリングに基づくユーザへのモデル自動適応
基于口语对话系统统一建模的自动模型适应用户
  • 批准号:
    23H03457
  • 财政年份:
    2023
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
音声対話システムにおける複数のふるまいの同時制御に基づくキャラクタ表現
语音对话系统中基于多种行为同时控制的人物表达
  • 批准号:
    23K20005
  • 财政年份:
    2023
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
対話タスク・ユーザに適したキャラクタを表現する音声対話システム
表达适合对话任务和用户的字符的语音对话系统
  • 批准号:
    20J22284
  • 财政年份:
    2020
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
階層的End-to-Endモデルに基づく音声対話における心的状態推定に関する研究
基于分层端到端模型的口语对话心理状态估计研究
  • 批准号:
    18J22864
  • 财政年份:
    2018
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Human movement and psychological studies on the influence of sports experience using auditory information by sound and voice
利用声音和语音的听觉信息研究运动体验影响的人体运动和心理学
  • 批准号:
    17KT0133
  • 财政年份:
    2017
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了