複数の共有構造を用いたアニーリングに基づく音響モデリング
使用多个共享结构的基于退火的声学建模
基本信息
- 批准号:11J05301
- 负责人:
- 金额:$ 0.83万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2011
- 资助国家:日本
- 起止时间:2011 至 2012
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では,複数のパラメータ共有構造を用い,確定的アニーリングEMアルゴリズムとベイズ基準を学習アルゴリズムに適用することで音声認識のための新しい音響モデリングの枠組みを提案する.初年度には,学習アルゴリズムの導出・実験及び考察を行い,国内外でその結果を発表してきた.今年度は提案法に関してさらに実験を重ねることで提案法の特徴や問題点等を考察・改善してきた.また,これまで提案法は音声認識に関しての統計的なモデリング手法として発表を行ってきているが,話者認識や音声合成といった統計モデルを基盤に用いる分野にも適用が可能である.そのため,話者認識や音声合成において提案法を適用するために,それぞれの最新の動向を調査し知見を広げるための研究活動も行った.話者認識に関しては,5ヶ月間エジンバラ大学の研究所に滞在し,話者認識の最新の動向や最新のデータ,問題点など様々な知見を得ることができた.また,海外の様々な分野の研究者とも議論を交わすことができ提案法に対する知見も深まった.さらに,音声合成の研究にも従事し,言語に依存しない話者の特徴をモデル化する研究を行ってきた.これにより話者性についての研究についても知識を深めることができ,かつ提案法の音声合成への適用についても検討することができた.今年度の研究活動の成果の国内外への発表件数は控えめではあるが,提案法について実験等をまとめ投稿した論文は採択され掲載されたため,当初の予定としては順調に進めることができたと言える.
This study で は, plural の パ ラ メ ー タ total of tectonic を い, determine the ア ニ ー リ ン グ EM ア ル ゴ リ ズ ム と ベ イ ズ benchmark study を ア ル ゴ リ ズ ム に applicable す る こ と で sounds know の た め の new し い sound モ デ リ ン グ の 枠 group み を proposal す る. Early annual に は, learning ア ル ゴ リ ズ ム の export, be 験 and び inspected を い, both at home and abroad で そ の results を 発 table し て き た. Our は proposal method に masato し て さ ら に be 験 を heavy ね る こ と で の proposal method, 徴 や problem を investigation, such as improving し て き た. ま た, こ れ ま で proposal method は sounds know に masato し て の statistics な モ デ リ ン グ gimmick と し て 発 table line を っ て き て い る が, understanding the speaker's words や voice synthesis と い っ た statistical モ デ ル を base plate に with い る eset に も Apply が may で あ る. そ の た め, understanding the speaker's words や voice synthesis に お い て proposal を applicable す る た め に, そ れ ぞ れ の の latest trends を survey し knowledge を hiroo げ る た め の research activities も line っ た. Understanding the speaker's words に masato し て は, 5 ヶ months エ ジ ン バ ラ university institute of の に lag in し, understanding the speaker's words の の latest trends や latest の デ ー タ, trouble spots な ど others 々 な knowledge を have る こ と が で き た. ま た, overseas の others 々 な eset researchers の と も comment を pay わ す こ と が で き proposal method に す seaborne deep ま る know see も っ た. さ ら に, voice synthesis の Research に も 従 し, speech に dependent し な い の the speaker's words, 徴 を モ デ ル change す る を line っ て き た. こ れ に よ り words sex に つ い て の research に つ い て も を deep knowledge め る こ と が で き, か つ proposal method の voice synthesis へ の applicable に つ い て も beg す 検 る こ と が で き た. Our の の の achievements at home and abroad research activities へ の 発 table number は control え め で は あ る が, proposal method に つ い て be 験 etc を ま と contribute め し た paper は mining 択 さ れ first white jasmines load さ れ た た め, original の designated と し て は suitable adjustable に into め る こ と が で き た と said え る.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Cross-lingual Speaker Adaptation for HMM-based speech synthesis using speaker interpolation based on perceptual characteristics
使用基于感知特征的说话人插值进行基于 HMM 的语音合成的跨语言说话人自适应
- DOI:
- 发表时间:2012
- 期刊:
- 影响因子:0
- 作者:Viviane de Franca Oliveira;Sayaka Shiota;Yoshihiko Nankaku;Keiichi Tokuda
- 通讯作者:Keiichi Tokuda
Speech recognition based on statistical models including multiple phonetic decision trees
基于统计模型(包括多个语音决策树)的语音识别
- DOI:10.1250/ast.32.236
- 发表时间:2011
- 期刊:
- 影响因子:0.7
- 作者:Sayaka Shiota;Kei Hashimoto;Yoshihiko Nankaku;Keiichi Tokuda
- 通讯作者:Keiichi Tokuda
Cross-lingual speaker adaptation for HMM-based speech synthesis using joint-eigenvoices with a space of perceptual characteristics
使用具有感知特征空间的联合特征语音进行基于 HMM 的语音合成的跨语言说话人自适应
- DOI:
- 发表时间:2013
- 期刊:
- 影响因子:0
- 作者:Viviane de Franca Olivera;Sayaka shiota;Kei Hashimoto;Yoshihiko Nankaku;Keiichi Tokuda
- 通讯作者:Keiichi Tokuda
A Bayesian Framework Using Multiple Model Structures for Speech Recognition
使用多个模型结构进行语音识别的贝叶斯框架
- DOI:10.1587/transinf.e96.d.939
- 发表时间:2013
- 期刊:
- 影响因子:0.7
- 作者:Sayaka Shiota;Kei Hashimoto;Yoshihiko Nankaku;Keiichi Tokuda,
- 通讯作者:Keiichi Tokuda,
個人性を考慮した異言語音声合成に対する知覚評価
考虑个性的跨语言语音合成感知评价
- DOI:
- 发表时间:2012
- 期刊:
- 影响因子:0
- 作者:津崎実;徳田恵一;河井恒;志賀芳則;大浦圭一郎;塩田さやか
- 通讯作者:塩田さやか
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
塩田 さやか其他文献
音学シンポジウム2018の開催にあたって
关于举办2018音韵学研讨会
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
齋藤 大輔;森勢 将雅;塩田 さやか;木谷 俊介;小橋川 哲;高道 慎之介;武岡 成人;橘 亮輔 - 通讯作者:
橘 亮輔
系列分類型ニューラルネットワークを用いた日本語方言識別の検討
基于顺序分类神经网络的日语方言识别研究
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
今泉 遼;増村 亮;塩田 さやか;貴家 仁志 - 通讯作者:
貴家 仁志
低周波成分への影響を考慮した非線形帯域拡張法と音声認識への応用
考虑低频分量影响的非线性频带扩展方法及其在语音识别中的应用
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
塩田 さやか;貴家 仁志 - 通讯作者:
貴家 仁志
悪条件な縦長行列向けのQR分解を使った前処理行列の性能についての一考察
病态垂直矩阵QR分解预处理矩阵性能研究
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
甲斐 優人;高道 慎之介;塩田 さやか;貴家 仁志;南畑 淳史 尾崎 克久 荻田 武史 大石 進一 - 通讯作者:
南畑 淳史 尾崎 克久 荻田 武史 大石 進一
拡張ラプラス変換型機械学習による自動運転車とドライバーの協調制御に関する一考察
基于增强拉普拉斯变换机器学习的自动驾驶车辆与驾驶员协同控制研究
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
宋 裕進;塩田 さやか;高道 慎之介;村上 大輔;松井 知子;猿渡 洋;安部 博枝,Luis Diago,南畑 淳史,萩原 一郎 - 通讯作者:
安部 博枝,Luis Diago,南畑 淳史,萩原 一郎
塩田 さやか的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('塩田 さやか', 18)}}的其他基金
セキュアな音声対話のための実環境なりすまし音声コーパス構築
构建真实世界的欺骗语音语料库以实现安全语音对话
- 批准号:
24K14993 - 财政年份:2024
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
相似海外基金
Development of virtual acoustics for a renewed practice of acoustical engineering and sound quality studies
开发虚拟声学以重新实践声学工程和声音质量研究
- 批准号:
RGPIN-2018-05386 - 财政年份:2022
- 资助金额:
$ 0.83万 - 项目类别:
Discovery Grants Program - Individual
Development of virtual acoustics for a renewed practice of acoustical engineering and sound quality studies
开发虚拟声学以重新实践声学工程和声音质量研究
- 批准号:
RGPIN-2018-05386 - 财政年份:2021
- 资助金额:
$ 0.83万 - 项目类别:
Discovery Grants Program - Individual
The influence of inaudible high frequency waves on sound quality and vital activities
听不见的高频波对音质和生命活动的影响
- 批准号:
20K12029 - 财政年份:2020
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Development of virtual acoustics for a renewed practice of acoustical engineering and sound quality studies
开发虚拟声学以重新实践声学工程和声音质量研究
- 批准号:
RGPIN-2018-05386 - 财政年份:2020
- 资助金额:
$ 0.83万 - 项目类别:
Discovery Grants Program - Individual
Impact of signal processing on perception of loudness and sound quality
信号处理对响度和音质感知的影响
- 批准号:
540164-2019 - 财政年份:2019
- 资助金额:
$ 0.83万 - 项目类别:
University Undergraduate Student Research Awards
Development of virtual acoustics for a renewed practice of acoustical engineering and sound quality studies
开发虚拟声学以重新实践声学工程和声音质量研究
- 批准号:
RGPIN-2018-05386 - 财政年份:2019
- 资助金额:
$ 0.83万 - 项目类别:
Discovery Grants Program - Individual
Development of virtual acoustics for a renewed practice of acoustical engineering and sound quality studies
开发虚拟声学以重新实践声学工程和声音质量研究
- 批准号:
DGECR-2018-00053 - 财政年份:2018
- 资助金额:
$ 0.83万 - 项目类别:
Discovery Launch Supplement
Development of virtual acoustics for a renewed practice of acoustical engineering and sound quality studies
开发虚拟声学以重新实践声学工程和声音质量研究
- 批准号:
RGPIN-2018-05386 - 财政年份:2018
- 资助金额:
$ 0.83万 - 项目类别:
Discovery Grants Program - Individual
The role of auditory memory in the perception of sound quality
听觉记忆在音质感知中的作用
- 批准号:
481645-2015 - 财政年份:2015
- 资助金额:
$ 0.83万 - 项目类别:
Alexander Graham Bell Canada Graduate Scholarships - Master's
Effect of locally plastic deformation process on cymbal sounds and its application to sound quality design of plate vibration sound
局部塑性变形过程对钹声的影响及其在板振声音质设计中的应用
- 批准号:
15K05860 - 财政年份:2015
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)














{{item.name}}会员




