音声の絶対的特徴と相対的特徴を融合した頑健で柔軟な音声情報処理技術の構築

构建鲁棒灵活的语音信息处理技术,结合语音的绝对特征和相对特征

基本信息

  • 批准号:
    11J08960
  • 负责人:
  • 金额:
    $ 0.83万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2011
  • 资助国家:
    日本
  • 起止时间:
    2011 至 2012
  • 项目状态:
    已结题

项目摘要

本研究では、主に二つの成果をあげた。一つ目は、大語彙連続音声認識において、音声の相対的特徴量を用いて性能向上を実現したことである。従来の大語彙連続音声認識手法は、計算の効率のため、音声の絶対的特徴量のみが用いられていた。本研究では、大語彙連続音声認識の後段処理にあたる、識別的リランキング処理に注目した。識別的リランキングの特徴量として、音声の相対的特徴量である構造的表象を用いることで、計算効率が高く、かつ精度の高い処理を実現することができた。二つ目は、雑音環境下に頑健な音声認識を実現するための雑音抑圧処理において、音声の動的な成分を適切に捉えて雑音抑圧処理を行う手法を開発し、高い性能を実現したことである。従来の雑音抑圧手法では、ある時刻フレームの音声特徴量を雑音抑圧するために、その時刻フレームの音声特徴量のみを用い、前後数フレーム分の特徴を用いていなかった。本研究では、前後数フレーム分の特徴量を入力とする手法を開発した。単純に前後数フレーム分の特徴量を入力とすると、過学習の問題が発生し、雑音抑圧性能は向上しない。本研究では、REDIAL(REgularized piecewise linear mapping with Discriminative region weighting And Long-span features)という手法を開発し、前後数フレーム分の特徴を適切に雑音処理に用いることに成功した。さらにこのREDIALは、雑音抑圧処理にとどまらず、帯域拡張処理、声質変換、マルチモーダル雑音抑圧の精度向上にも有効であることを示した。
这项研究产生了两个主要结果。首先是使用语音的相对特征在大型词汇连续语音识别中取得了改进。在传统的大型词汇连续语音识别方法中,仅使用语音的绝对特征用于计算效率。在这项研究中,我们专注于判别的重新处理处理,这是大型词汇连续语音识别的后处理。通过使用结构表示,这是语音的相对特征,因为可以实现具有高度计算效率和高精度的判别重新依据的特征量。第二个是,在噪声抑制处理中以在噪声环境中实现强大的语音识别时,已经开发了一种方法来正确捕获语音的动态组成部分并执行噪声抑制处理,从而实现了高性能。在常规的噪声抑制方法中,为了抑制特定时间范围的语音特征量,仅使用该时间范围的语音特征,并且不使用前面和几个帧的特征。在这项研究中,我们开发了一种方法,其中具有以前和后续帧的特征。仅针对下一个和下一个框架输入特征数量,就会导致学习问题,而抑制噪声抑制性能并不能改善。在这项研究中,我们开发了一种称为REDIAIL(具有判别性区域加权和长跨度特征的正规分段线性映射的方法),并在正确处理之前和之后成功使用了几个帧的特征。此外,已经表明,这种重复不仅对噪声抑制处理有效,而且还可以提高频带扩展处理,语音质量转换和多模式噪声抑制的准确性。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
コンディション変数の導入によるミスマッチがない場合にも頑健なステレオベース特徴量強調
即使在不存在不匹配的情况下,通过引入条件变量也能实现鲁棒的基于立体的特征增强
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鈴木雅之; 峯松信明;広瀬啓古
  • 通讯作者:
    広瀬啓古
音声の構造的表象を用いた大語彙音声認識の識別的リランキング
使用语音结构表示对大词汇量语音识别进行判别性重排序
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    淡路遼;今野晃嗣;SeanLee;齋藤慈子;長谷川寿一;尾崎洋輔,峯松信明,広瀬啓吉,エリクソン・ドナ;今野晃嗣;鈴木雅之,倉田岳人,西村雅史,峯松信明,広瀬啓吉
  • 通讯作者:
    鈴木雅之,倉田岳人,西村雅史,峯松信明,広瀬啓吉
An experimental study on dynamic features of speech structure
语音结构动态特征的实验研究
MFCC enhancement using joint corrupted and noise feature space for highly non-stationary noise environment
使用联合损坏和噪声特征空间对高度非平稳噪声环境进行 MFCC 增强
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    M.Suzuki;T.Yoshioka;S.Watanabe;N.Minematsu;K.
  • 通讯作者:
    K.
Combination of SPLICE and feature normalization for noise robust speech recognition
SPLICE 和特征归一化的组合用于噪声鲁棒语音识别
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

鈴木 雅之其他文献

ブレイクの「システム」論─『個展作品解説目録」(1809)を中心に
布莱克的“系统”理论——以《个展作品说明目录》为中心(1809)
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    吉本和弘;吉本和弘;吉本和弘;吉本和弘;吉本和弘;吉本和弘;吉本和弘;吉本和弘;鈴木 雅之;鈴木 雅之;Masashi Suzuki and Steve Clark;鈴木 雅之;鈴木 雅之;鈴木 雅之;鈴木 雅之;鈴木 雅之
  • 通讯作者:
    鈴木 雅之
Book Review: Richard Dutton, Shakespeare, Court Dramarist (Ozford UP, 2016)
书评:理查德·达顿,莎士比亚,宫廷剧作家(Ozford UP,2016)
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    吉本和弘;吉本和弘;吉本和弘;吉本和弘;吉本和弘;吉本和弘;吉本和弘;吉本和弘;鈴木 雅之;鈴木 雅之;Masashi Suzuki and Steve Clark;鈴木 雅之;鈴木 雅之;鈴木 雅之;鈴木 雅之;鈴木 雅之;鈴木 雅之;鈴木 雅之ほか9名;鈴木 雅之(共著);鈴木 雅之(共著);小林潤司;杉浦裕子
  • 通讯作者:
    杉浦裕子
最近のシェイクスピアの伝記研究(研究発表要旨)
莎士比亚的最新传记研究(研究报告摘要)
Problems of Body and Soul in Schiller's "Philosophy of Physiology"
席勒《生理学哲学》中的身体与灵魂问题
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鈴木 雅之;Masashi SUZUKI;鈴木 雅之;Masashi SUZUKI;鈴木 雅之;津田保夫;Yasuo Tsuda;津田保夫;津田保夫;津田保夫;Yasuo Tsuda
  • 通讯作者:
    Yasuo Tsuda
誠実な手と忠実な眼
诚实的手和忠诚的眼睛
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Irene Weber-Henking;Susan Bernofsky;Marion Graf;Fuminari Niiumoto;Teresa Vinardell Puig;鈴木雅之;新本 史斉;鈴木雅之;フランツ・ヒンターエーダー=エムデ;鈴木雅之;フランツ・ヒンターエーダー=エムデ;鈴木雅之;新本史斉;鈴木 雅之
  • 通讯作者:
    鈴木 雅之

鈴木 雅之的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('鈴木 雅之', 18)}}的其他基金

Literary Gallery and British Romanticism and Culture
文学画廊与英国浪漫主义和文化
  • 批准号:
    23K00380
  • 财政年份:
    2023
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
部活動動機づけと学習動機づけの相互関係の検討:転移のメカニズムと促進要因の検討
考察课外活动动机与学习动机之间的相互关系:考察转移机制和促进因素
  • 批准号:
    23K02862
  • 财政年份:
    2023
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
テストが教師と学習者に及ぼす影響-テスト観に着目して-
测试对教师和学习者的影响 - 聚焦测试的角度 -
  • 批准号:
    10J10553
  • 财政年份:
    2010
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
科学実験器具と18世紀イギリス文化
科学实验室设备和 18 世纪英国文化
  • 批准号:
    12871054
  • 财政年份:
    2000
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
17世紀から20世紀における英米の科学詩の主題別研究
17至20世纪英美科学诗歌专题研究
  • 批准号:
    07610465
  • 财政年份:
    1995
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
E・ヤング、『夜想』及びその挿絵集の研究
E. Young《夜思》及其插图集研究
  • 批准号:
    05610388
  • 财政年份:
    1993
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
ウィリアム・ブレイクと自然宗教の研究
威廉·布莱克和自然宗教研究
  • 批准号:
    63510258
  • 财政年份:
    1988
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)

相似海外基金

The Effect of Visual Stimuli on Sound Representation in the Macaque Inferior Colliculus
视觉刺激对猕猴下丘声音表征的影响
  • 批准号:
    10601229
  • 财政年份:
    2022
  • 资助金额:
    $ 0.83万
  • 项目类别:
Degrees of relevance? The neuronal representation of sound sources in primary auditory cortex during active localization
相关程度?
  • 批准号:
    418090239
  • 财政年份:
    2019
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Research Grants
The neural representation of sound in complex auditory environments
复杂听觉环境中声音的神经表征
  • 批准号:
    9395398
  • 财政年份:
    2017
  • 资助金额:
    $ 0.83万
  • 项目类别:
Acoustic-to-articulatory conversion based on integration of EMA-based measurement and statistical media conversion techniques
基于 EMA 测量和统计媒体转换技术集成的声学到发音转换
  • 批准号:
    15K12059
  • 财政年份:
    2015
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
要素技術の再構成・再解釈に着眼したニューラルネット音声認識システムの高度化
神经网络语音识别系统的复杂性侧重于基本技术的重新配置和重新解释
  • 批准号:
    14J09167
  • 财政年份:
    2014
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了