权益分类	功能权益	普通用户	{{item.name}}会员
{{category.name}}	{{benefitItem.name}}

複数の共有構造を用いたアニーリングに基づく音響モデリング

使用多个共享结构的基于退火的声学建模

基本信息

批准号：
11J05301
负责人：
塩田さやか
金额：
$ 0.83万
依托单位：
Nagoya Institute of Technology
依托单位国家：
日本
项目类别：
Grant-in-Aid for JSPS Fellows
财政年份：
2011
资助国家：
日本
起止时间：
2011 至 2012
项目状态：
已结题

项目摘要

本研究では,複数のパラメータ共有構造を用い,確定的アニーリングEMアルゴリズムとベイズ基準を学習アルゴリズムに適用することで音声認識のための新しい音響モデリングの枠組みを提案する.初年度には,学習アルゴリズムの導出・実験及び考察を行い,国内外でその結果を発表してきた.今年度は提案法に関してさらに実験を重ねることで提案法の特徴や問題点等を考察・改善してきた.また,これまで提案法は音声認識に関しての統計的なモデリング手法として発表を行ってきているが,話者認識や音声合成といった統計モデルを基盤に用いる分野にも適用が可能である.そのため,話者認識や音声合成において提案法を適用するために,それぞれの最新の動向を調査し知見を広げるための研究活動も行った.話者認識に関しては,5ヶ月間エジンバラ大学の研究所に滞在し,話者認識の最新の動向や最新のデータ,問題点など様々な知見を得ることができた.また,海外の様々な分野の研究者とも議論を交わすことができ提案法に対する知見も深まった.さらに,音声合成の研究にも従事し,言語に依存しない話者の特徴をモデル化する研究を行ってきた.これにより話者性についての研究についても知識を深めることができ,かつ提案法の音声合成への適用についても検討することができた.今年度の研究活動の成果の国内外への発表件数は控えめではあるが,提案法について実験等をまとめ投稿した論文は採択され掲載されたため,当初の予定としては順調に進めることができたと言える.

This study では, plural のパラメータ total of tectonic をい, determine the アニーリング EM アルゴリズムとベイズ benchmark study をアルゴリズムに applicable することで sounds know のための new しい sound モデリングの枠 group みを proposal する. Early annual には, learning アルゴリズムの export, be 験 and び inspected をい, both at home and abroad でその results を発 table してきた. Our は proposal method に masato してさらに be 験を heavy ねることでの proposal method, 徴や problem を investigation, such as improving してきた. また, これまで proposal method は sounds know に masato しての statistics なモデリング gimmick として発 table line をってきているが, understanding the speaker's words や voice synthesis といった statistical モデルを base plate に with いる eset にも Apply が may である. そのため, understanding the speaker's words や voice synthesis において proposal を applicable するために, それぞれのの latest trends を survey し knowledge を hiroo げるための research activities も line った. Understanding the speaker's words に masato しては, 5 ヶ months エジンバラ university institute of のに lag in し, understanding the speaker's words のの latest trends や latest のデータ, trouble spots など others 々な knowledge を have ることができた. また, overseas の others 々な eset researchers のとも comment を pay わすことができ proposal method にす seaborne deep まる know see もった. さらに, voice synthesis の Research にも従し, speech に dependent しないの the speaker's words, 徴をモデル change するを line ってきた. これにより words sex についての research についてもを deep knowledge めることができ, かつ proposal method の voice synthesis への applicable についても beg す検ることができた. Our ののの achievements at home and abroad research activities への発 table number は control えめではあるが, proposal method について be 験 etc をまと contribute めした paper は mining 択され first white jasmines load されたため, original の designated としては suitable adjustable に into めることができたと said える.