実環境における音源分離と分離音認識を統合したロボット聴覚

集真实环境声源分离和分离声音识别于一体的机器人听觉

基本信息

  • 批准号:
    05J50562
  • 负责人:
  • 金额:
    $ 1.09万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2005
  • 资助国家:
    日本
  • 起止时间:
    2005 至 2006
  • 项目状态:
    已结题

项目摘要

1.リアルタイム同時発話認識システムの認識率向上と音声対話の実装これまでに開発したリアルタイム同時発話認識システムの認識率を向上させるために,高精度な音源定位手法であるMUSIC法の導入し,MFTのための特徴量の再検討を行った.また,本システムを利用した料理の同時注文認識や口じゃんけんなどの音声対話を実装してその有効性を確認した.2.ロボット聴覚の音源同定システムの開発実環境では様々な音が聞こえるので,汎用的なロボット聴覚システムを実現するためには,入力された音がどのような種類の音であるかを分類する音源同定システムが必要である.そのような音源同定システムを実現するために,階層的な音源モデルによる音源同定手法を開発し,ミッシングフィーチャ理論(MFT)によってノイズロバスト性を向上させた.(1)混合正規分布モデル(GMM)による階層的な音源モデルによる音源同定多様な音を認識するために,音オントロジーと呼ばれる音の階層的表現を行う場合,あらゆる音を表現できるようにすると非常に複雑な階層表現となる.しかし,これまでに開発されている音環境理解システム,たとえば音声認識,話者認識,楽器音認識などの技術を利用することができるので,音の階層表現の上位階層の部分についての分類を行うことができる音源同定手法の開発を行う.本研究では,音声,音楽,環境音などの音を階層的に表現し,それぞれをGMMによって音源モデルを構築した.そして,入力音に対して階層的な音源同定結果を得るシステムのプロトタイプを開発した.(2)MFTによるノイズへの対応実環境ではターゲットの音だけではなくさまざまなノイズが入力される.そのノイズに対応するためにMFTを導入することによりノイズロバスト性を向上させた.その同時発話認識のためのMFTの技術を本音源同定システムにも適用し,ノイズロバスト性を向上させた.
1. The introduction of MUSIC method for high-precision audio source localization, and the re-investigation of MFT characteristics. 2. The sound source identification of the sound source identification is necessary for the development of the sound source identification environment. The sound source identification method is developed according to the sound source identification theory (MFT). (1)Mixed Normal Distribution (GMM): The sound source of the hierarchy is the same as the sound source of the hierarchy. The development of sound environment understanding, sound recognition, speaker recognition, sound recognition technology utilization, sound hierarchy performance, upper level classification, sound source identification, etc. In this study, the performance of sound, music, and environmental music was studied. In addition, the input sound level of the sound source is determined as a result of the development of the system. (2) The MFT is designed for the environment, and the sound of the environment is not required. MFT is the most important way to improve the quality of products. At the same time, the technology of MFT is applied to the same system of sound source, and the characteristics of MFT are improved.

项目成果

期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Making A Robot Recognize Three Simultaneous Sentences in Real-Time
让机器人实时识别三个同时出现的句子
遺伝的アルゴリズムを用いたパラメータ最適化による話者位置に基づく同時発話認識の向上
使用遗传算法通过参数优化改进基于说话者位置的同步语音识别
Enhanced Robot Speech Recognition Based on Microphone Array Source Separation and Missing Feature Theory
Leak Energy based Missing Feature Mask Generation for ICA and GSS and Its Evaluation with Simultaneous Speech Recognition
基于泄漏能量的 ICA 和 GSS 缺失特征模板生成及其同步语音识别评估
Multiple Moving Speaker Tracking by Microphone Array on Mobile Robot
移动机器人上麦克风阵列的多移动扬声器跟踪
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

山本 俊一其他文献

Robot Audition : Its Issues and State of the Art (invited talk)
机器人试镜:其问题和最新技术(特邀演讲)
ミッシングフィーチャ理論に基づく音声認識を利用した複数話者同時発話認識,計測と制御
基于缺失特征理论的语音识别多说话人同时语音识别、测量与控制
ミッシングフィーチャ理論に基づく音声認識を利用した複数話者同時発話認識
基于缺失特征理论的语音识别多说话人同时语音识别
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Naohiro Hayashibara;Makoto Takizawa;Jean-Marc Valin;神田 直之;Kazuyoshi Yoshii;Tetsuro Kitahara;山本 俊一;Kazuyoshi Yoshi;Tetsuro Kitahara;山本 俊一
  • 通讯作者:
    山本 俊一
ミッシングフィーチャ理論を利用した音源分離と音声認識のインターフェースと複数ロボットへの適用
使用缺失特征理论的声源分离和语音识别接口及其在多个机器人中的应用
Ugi反応を基軸としたイソキノリンアルカロイド類の合成研究
基于Ugi反应的异喹啉生物碱合成研究
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kenta Oku;Shinsuke Nakajima;Jun Miyazaki;Shunsuke Uemura;黒瀧 俊輔;K.Nakakoji;M. Isomura;山本 俊一;赤岩路則
  • 通讯作者:
    赤岩路則

山本 俊一的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('山本 俊一', 18)}}的其他基金

疫学方法論の開発に関する研究
流行病学方法学发展研究
  • 批准号:
    X00050----337022
  • 财政年份:
    1978
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Grant-in-Aid for Co-operative Research (A)
山梨県における肝がん・肝硬変発生要因の解明に関する研究
山梨县肝癌和肝硬化病因的研究
  • 批准号:
    X00080----348161
  • 财政年份:
    1978
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (B)
病因解明のための疫学理論の体系化と疫学方法論の開発
流行病学理论的系统化和流行病学方法的发展以阐明发病机制
  • 批准号:
    X00050----237022
  • 财政年份:
    1977
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Grant-in-Aid for Co-operative Research (A)
ウレアーゼと蛋白栄養効率に関する研究
脲酶和蛋白质营养效率研究
  • 批准号:
    X42440----730012
  • 财政年份:
    1967
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Particular Research

相似海外基金

機械学習による音源分離に立脚したAUVの物体検知の高精度化の研究
利用机器学习提高基于声源分离的AUV目标检测精度研究
  • 批准号:
    24K07923
  • 财政年份:
    2024
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
統計的音源分離を用いた音響センシングでの非侵襲胎児心音計測の研究
基于统计声源分离的声学传感无创胎心音测量研究
  • 批准号:
    23K28111
  • 财政年份:
    2024
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
独立性と振幅位相モデルに基づく音源分離の数理的深化及びマルチモーダル補聴器開発
基于独立性和幅相模型的声源分离数学深化及多模态助听器开发
  • 批准号:
    23K24908
  • 财政年份:
    2024
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
オンデマンドな音環境理解のための教師なしモノラル音源分離に関する研究
用于按需声环境理解的无监督单声道声源分离研究
  • 批准号:
    24KJ2096
  • 财政年份:
    2024
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
選択的音楽聴取を実現するリアルタイム音源分離とその応用
实时声源分离及其在选择性音乐收听中的应用
  • 批准号:
    22KJ2548
  • 财政年份:
    2023
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
統計的音源分離を用いた音響センシングでの非侵襲胎児心音計測の研究
基于统计声源分离的声学传感无创胎心音测量研究
  • 批准号:
    23H03421
  • 财政年份:
    2023
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
多チャネル音源分離のための独立非全結合型深層学習行列分析の提案
多通道声源分离的独立非全连接深度学习矩阵分析的提出
  • 批准号:
    20K11886
  • 财政年份:
    2020
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Development of sound source separation method focusing on the singular point in spatio-temporal spectrum
时空谱奇异点声源分离方法研究进展
  • 批准号:
    19K04408
  • 财政年份:
    2019
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Correlating sound source separation and novelty detection in the mammalian auditory midbrain
哺乳动物听觉中脑中声源分离与新颖性检测的相关性
  • 批准号:
    444301-2013
  • 财政年份:
    2014
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Postgraduate Scholarships - Doctoral
RI: Small: Binaural Sound Source Separation Robust to Listener Head Movements
RI:小:双耳声源分离对听众头部运动具有鲁棒性
  • 批准号:
    1320059
  • 财政年份:
    2013
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了