音声の絶対的特徴と相対的特徴を融合した頑健で柔軟な音声情報処理技術の構築

构建鲁棒灵活的语音信息处理技术,结合语音的绝对特征和相对特征

基本信息

  • 批准号:
    11J08960
  • 负责人:
  • 金额:
    $ 0.83万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2011
  • 资助国家:
    日本
  • 起止时间:
    2011 至 2012
  • 项目状态:
    已结题

项目摘要

本研究では、主に二つの成果をあげた。一つ目は、大語彙連続音声認識において、音声の相対的特徴量を用いて性能向上を実現したことである。従来の大語彙連続音声認識手法は、計算の効率のため、音声の絶対的特徴量のみが用いられていた。本研究では、大語彙連続音声認識の後段処理にあたる、識別的リランキング処理に注目した。識別的リランキングの特徴量として、音声の相対的特徴量である構造的表象を用いることで、計算効率が高く、かつ精度の高い処理を実現することができた。二つ目は、雑音環境下に頑健な音声認識を実現するための雑音抑圧処理において、音声の動的な成分を適切に捉えて雑音抑圧処理を行う手法を開発し、高い性能を実現したことである。従来の雑音抑圧手法では、ある時刻フレームの音声特徴量を雑音抑圧するために、その時刻フレームの音声特徴量のみを用い、前後数フレーム分の特徴を用いていなかった。本研究では、前後数フレーム分の特徴量を入力とする手法を開発した。単純に前後数フレーム分の特徴量を入力とすると、過学習の問題が発生し、雑音抑圧性能は向上しない。本研究では、REDIAL(REgularized piecewise linear mapping with Discriminative region weighting And Long-span features)という手法を開発し、前後数フレーム分の特徴を適切に雑音処理に用いることに成功した。さらにこのREDIALは、雑音抑圧処理にとどまらず、帯域拡張処理、声質変換、マルチモーダル雑音抑圧の精度向上にも有効であることを示した。
This research is the result of two main research projects. A word, a word, a sound, a sound. The method of recognition of large words and sounds is used to calculate the efficiency and the characteristics of sounds. This study focuses on the post-processing of the recognition of large words and sounds. The characteristic quantity of recognition, the characteristic quantity of sound and the corresponding structure, the representation of structure, the calculation efficiency and the precision of processing are realized. Second, sound recognition in sound environment is realized, sound suppression processing is realized, sound dynamic components are appropriately captured, sound suppression processing is realized, and high performance is realized. The sound suppression method is used to suppress the sound characteristics of the sound system at different times. This study is based on the analysis of the characteristics of the front and rear parts of the paper. The characteristics of the pure front and rear parts are introduced into the force, and the problem of over-learning occurs, and the sound suppression performance is improved. In this study, REDIAL(Regularized piecewise linear mapping with Discriminative region weighting And Long-span features) was successfully used. In addition, this REDIAL shows that it is effective in improving the accuracy of sound suppression, band expansion processing, sound quality conversion, and sound suppression.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
コンディション変数の導入によるミスマッチがない場合にも頑健なステレオベース特徴量強調
即使在不存在不匹配的情况下,通过引入条件变量也能实现鲁棒的基于立体的特征增强
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鈴木雅之; 峯松信明;広瀬啓古
  • 通讯作者:
    広瀬啓古
音声の構造的表象を用いた大語彙音声認識の識別的リランキング
使用语音结构表示对大词汇量语音识别进行判别性重排序
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    淡路遼;今野晃嗣;SeanLee;齋藤慈子;長谷川寿一;尾崎洋輔,峯松信明,広瀬啓吉,エリクソン・ドナ;今野晃嗣;鈴木雅之,倉田岳人,西村雅史,峯松信明,広瀬啓吉
  • 通讯作者:
    鈴木雅之,倉田岳人,西村雅史,峯松信明,広瀬啓吉
MFCC enhancement using joint corrupted and noise feature space for highly non-stationary noise environment
使用联合损坏和噪声特征空间对高度非平稳噪声环境进行 MFCC 增强
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    M.Suzuki;T.Yoshioka;S.Watanabe;N.Minematsu;K.
  • 通讯作者:
    K.
An experimental study on dynamic features of speech structure
语音结构动态特征的实验研究
Combination of SPLICE and feature normalization for noise robust speech recognition
SPLICE 和特征归一化的组合用于噪声鲁棒语音识别
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

鈴木 雅之其他文献

ブレイクの「システム」論─『個展作品解説目録」(1809)を中心に
布莱克的“系统”理论——以《个展作品说明目录》为中心(1809)
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    吉本和弘;吉本和弘;吉本和弘;吉本和弘;吉本和弘;吉本和弘;吉本和弘;吉本和弘;鈴木 雅之;鈴木 雅之;Masashi Suzuki and Steve Clark;鈴木 雅之;鈴木 雅之;鈴木 雅之;鈴木 雅之;鈴木 雅之
  • 通讯作者:
    鈴木 雅之
最近のシェイクスピアの伝記研究(研究発表要旨)
莎士比亚的最新传记研究(研究报告摘要)
Book Review: Richard Dutton, Shakespeare, Court Dramarist (Ozford UP, 2016)
书评:理查德·达顿,莎士比亚,宫廷剧作家(Ozford UP,2016)
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    吉本和弘;吉本和弘;吉本和弘;吉本和弘;吉本和弘;吉本和弘;吉本和弘;吉本和弘;鈴木 雅之;鈴木 雅之;Masashi Suzuki and Steve Clark;鈴木 雅之;鈴木 雅之;鈴木 雅之;鈴木 雅之;鈴木 雅之;鈴木 雅之;鈴木 雅之ほか9名;鈴木 雅之(共著);鈴木 雅之(共著);小林潤司;杉浦裕子
  • 通讯作者:
    杉浦裕子
Le tryptique japonais de Jacques Proust
雅克·普鲁斯特的日本胰脏
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    楠見清;齋藤希史;Mitsuyoshi Numano;TERADA Motoichi;野田研一;荻原 理;鈴木雅之;楠見清;Motoyuki Shibata;荻原 理;野田研一;齋藤希史;玉田敦子;鈴木雅之;柴田元幸;大芝 芳弘;楠見清;久守和子;大石和欣;齋藤希史;Yoichi SUMI;土橋 茂樹;山里勝己;楠見清;加藤有子;長崎広子;Kazuyoshi Oishi;齋藤希史;Takeshi Koseki;土橋 茂樹;加藤有子;楠見清;山里勝己;土橋 茂樹;鷲見洋一;鈴木 雅之;齋藤希史;長崎広子;柴田元幸;楠見清;土橋 茂樹;山里勝己(編著);齋藤希史;楠見清;草光俊雄・北川勝彦;加藤有子;北田信;寺田元一
  • 通讯作者:
    寺田元一
漢字圏植民地与近代日本文語文,比較殖民地主義與文化 國際學術工作坊
汉字地区殖民与日本现代文学、比较殖民主义与文化 国际学习工房
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    楠見清;齋藤希史;Mitsuyoshi Numano;TERADA Motoichi;野田研一;荻原 理;鈴木雅之;楠見清;Motoyuki Shibata;荻原 理;野田研一;齋藤希史;玉田敦子;鈴木雅之;柴田元幸;大芝 芳弘;楠見清;久守和子;大石和欣;齋藤希史;Yoichi SUMI;土橋 茂樹;山里勝己;楠見清;加藤有子;長崎広子;Kazuyoshi Oishi;齋藤希史;Takeshi Koseki;土橋 茂樹;加藤有子;楠見清;山里勝己;土橋 茂樹;鷲見洋一;鈴木 雅之;齋藤希史;長崎広子;柴田元幸;楠見清;土橋 茂樹;山里勝己(編著);齋藤希史;楠見清;草光俊雄・北川勝彦;加藤有子;北田信;寺田元一;高田賢一(山里勝己編著);近藤 智彦;楠見清;北田信;齋藤希史
  • 通讯作者:
    齋藤希史

鈴木 雅之的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('鈴木 雅之', 18)}}的其他基金

Literary Gallery and British Romanticism and Culture
文学画廊与英国浪漫主义和文化
  • 批准号:
    23K00380
  • 财政年份:
    2023
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
部活動動機づけと学習動機づけの相互関係の検討:転移のメカニズムと促進要因の検討
考察课外活动动机与学习动机之间的相互关系:考察转移机制和促进因素
  • 批准号:
    23K02862
  • 财政年份:
    2023
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
テストが教師と学習者に及ぼす影響-テスト観に着目して-
测试对教师和学习者的影响 - 聚焦测试的角度 -
  • 批准号:
    10J10553
  • 财政年份:
    2010
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
科学実験器具と18世紀イギリス文化
科学实验室设备和 18 世纪英国文化
  • 批准号:
    12871054
  • 财政年份:
    2000
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
17世紀から20世紀における英米の科学詩の主題別研究
17至20世纪英美科学诗歌专题研究
  • 批准号:
    07610465
  • 财政年份:
    1995
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
E・ヤング、『夜想』及びその挿絵集の研究
E. Young《夜思》及其插图集研究
  • 批准号:
    05610388
  • 财政年份:
    1993
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
ウィリアム・ブレイクと自然宗教の研究
威廉·布莱克和自然宗教研究
  • 批准号:
    63510258
  • 财政年份:
    1988
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)

相似海外基金

言語情報とパラ言語情報を統合した音声の構造的表象の提案とその音声合成への応用
整合语言和副语言信息的语音结构表示的提出及其在语音合成中的应用
  • 批准号:
    19650036
  • 财政年份:
    2007
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了