識別モデルを用いた音声認識手法の構築

利用判别模型构建语音识别方法

基本信息

  • 批准号:
    11J07750
  • 负责人:
  • 金额:
    $ 0.83万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2011
  • 资助国家:
    日本
  • 起止时间:
    2011 至 2012
  • 项目状态:
    已结题

项目摘要

本研究においては,実環境における自然な発話の音声認識性能の向上を目的として,識別モデルを用いた音声認識手法に関して検討を行った.本研究では特に,特徴抽出機能を有した識別モデルであるHidden Conditional Neural Fields (HCNF)を提案し,音声認識における有効性について調査した.前年度までに,モデルの学習法の検討および連続音素・音節認識による評価を行ったため,今年度は,前年度までの成果に関する論文投稿,HCNFの大規模化(コンテキスト依存モデル,N-gramモデルの利用),大語彙連続音声認識の実現,さらなる高精度化,およびその評価を目標とした.本年度はまず,前年度までに得られていた成果についてまとめた英語論文が英語雑誌論文に再録され,1つ目の目標を達成できた.次に,HCNFを大規模化するために,HCNFを扱うことができる大語彙連続音声認識デコーダの開発を行った.デコーダは,HCNFを重み付き有限状態トランスデューサー(WFST)として表現することで効率的に実装可能であった,WFSTは音響的なコンテキスト依存性や高次のN-gram言語モデルを自然に表現することが可能であり,デコーダの記述を簡単化できる.このデコーダからラティスを出力することで,負例を表す仮説集合の近似表現を大規模タスクにおいても取得することができるようになった.さらに,近年音声認識において顕著な成功を収めているDeep Belief Network (DBN)をHCNFの初期値として使用する方法についても検討し,音声認識精度を改善できた.現在は,大語彙連続音声認識のタスクでモデルを評価中である.得られた研究成果については,国際会議及び英語論文としてまとめる予定である.
This study に お い て は, be environment に お け る natural な 発 words の sounds know performance の を up purpose と し て, identify モ デ ル を with い た sounds know technique に masato し て 検 line for を っ た. This study で は に, especially 徴 extraction function を have し た recognition モ デ ル で あ る Hidden Conditional Neural Fields (HCNF) し を proposal sounds know に お け る have sharper sex に つ い て survey し た. Before the annual ま で に, モ デ ル の learning method の beg お 検 よ び even 続 phoneme, syllable know に よ る review 価 を line っ た た め, our は ", before the annual ま で の results に masato す る paper submitted, HCNF の large scale (コ ン テ キ ス ト dependent モ デ ル, N - "gramm モ デ ル の use), large vocabulary even 続 sounds know の be now, さ ら な る high precision Youdaoplaceholder0 およびそ evaluate 価を objective と た. Before this year's は ま ず, annual ま で に have ら れ て い た results に つ い て ま と め た English thesis が 雑 に tzu paper and record さ れ, 1 つ の target を reached で き た. Time に HCNF を large scale す る た め に, HCNF を Cha う こ と が で き る large vocabulary even 続 sounds know デ コ ー ダ の open 発 を line っ た. デ コ ー ダ は, HCNF を heavy み pay き finite state ト ラ ン ス デ ュ ー サ ー (WFST) と し て performance す る こ と で に sharper rates may be loaded で あ っ た, WFST は sound of な コ ン テ キ ス ト dependency や の high times N - "gramm words モ デ ル を natural に performance す る こ と が may で あ り, デ コ ー ダ の account を Jane 単 change で き る. こ の デ コ ー ダ か ら ラ テ ィ ス を output す る こ と で, negative example を table す 仮 said collection の approximation performance を large-scale タ ス ク に お い て も obtain す る こ と が で き る よ う に な っ た. さ ら に, in recent years sounds know に お い て 顕 the な successful を 収 め て い る Deep are Network (DBN) を HCNF の early numerical と し て use す る method に つ い て も 検 for し, sounds know precision を で き た. は now, big vocabulary even 続 sounds know の タ ス ク で モ デ ル を review in 価 で あ る. Have to ら れ た research に つ い て は, international conference and び English thesis と し て ま と め る designated で あ る.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Hidden Conditional Neural Fields for Continuous Phoneme Speech Recognition
  • DOI:
    10.1587/transinf.e95.d.2094
  • 发表时间:
    2012-08
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yasuhisa Fujii;Kazumasa Yamamoto;S. Nakagawa
  • 通讯作者:
    Yasuhisa Fujii;Kazumasa Yamamoto;S. Nakagawa
DEEP-HIDDEN CONDITIONAL NEURAL FIELDS FOR CONTINUOUS PHONEME SPEECH RECOGNITION
用于连续音素语音识别的深层隐藏条件神经场
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yasuhisa Fujii;Kazumasa Yamamoto;Seiichi Nakagawa
  • 通讯作者:
    Seiichi Nakagawa
Automatic speech recognition using Hidden Conditional Neural Fields
Hidden Boosted MMI and Hierarchical State Posterior Feature for Automatic Speech Recognition based on Hidden Conditional Neural Fields
基于隐藏条件神经场的自动语音识别的隐藏增强人机界面和分层状态后验特征
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yasuhisa Fujii;Kazumasa Yamamoto;Seiichi Nakagawa
  • 通讯作者:
    Seiichi Nakagawa
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

藤井 康寿其他文献

A Study of Speaker Identification Using Phoneme-lnformation
利用音素信息识别说话人的研究
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中川 聖一;富樫 慎吾;山口 優;藤井 康寿;北岡 教英;Katsuyuki Obayashi
  • 通讯作者:
    Katsuyuki Obayashi
講義音声ドキュメンのコンテンツ化と視聴システム
讲座音频文档内容创建及查看系统

藤井 康寿的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('藤井 康寿', 18)}}的其他基金

クラック先端のプロセスゾーンの長さを推定する手法の研究
裂纹尖端加工区长度估算方法研究
  • 批准号:
    07750545
  • 财政年份:
    1995
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

Identification and impact of polymers on stem cell products in an automated biomanufacturing platform
自动化生物制造平台中聚合物对干细胞产品的识别和影响
  • 批准号:
    10089013
  • 财政年份:
    2024
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Collaborative R&D
SBIR Phase II: FlashPCB Service Commercialization and AI Component Package Identification
SBIR第二阶段:FlashPCB服务商业化和AI组件封装识别
  • 批准号:
    2335464
  • 财政年份:
    2024
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Cooperative Agreement
I-Corps: Fisheries Management Through Species Identification Technology
I-Corps:通过物种识别技术进行渔业管理
  • 批准号:
    2348772
  • 财政年份:
    2024
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Standard Grant
Direct identificationによる膵癌HLAリガンドームの解明
通过直接鉴定阐明胰腺癌 HLA 配体组
  • 批准号:
    24K10425
  • 财政年份:
    2024
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
SCAnDi: Single-cell and single molecule analysis for DNA identification
SCAnDi:用于 DNA 鉴定的单细胞和单分子分析
  • 批准号:
    ES/Y010655/1
  • 财政年份:
    2024
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Research Grant
Identification of genes responsible for the resistance to first line anti-myeloma therapeutics
鉴定导致一线抗骨髓瘤治疗耐药的基因
  • 批准号:
    24K11532
  • 财政年份:
    2024
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Enzymeless nanopore proteoform identification
无酶纳米孔蛋白形式鉴定
  • 批准号:
    EP/Z000351/1
  • 财政年份:
    2024
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Research Grant
視線を用いた文章に対する補足説明システムの開発を目的とした表情識別モデルの選定
选择面部表情识别模型以开发凝视句子补充解释系统
  • 批准号:
    24H02481
  • 财政年份:
    2024
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Encouragement of Scientists
Particle classification and identification in cryoET of crowded cellular environments
拥挤细胞环境中 CryoET 中的颗粒分类和识别
  • 批准号:
    BB/Y514007/1
  • 财政年份:
    2024
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Research Grant
Developing a new method for the identification of cancer in archaeological populations
开发一种鉴定考古群体中癌症的新方法
  • 批准号:
    2341415
  • 财政年份:
    2024
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了