話者認識のための局所話者識別的特徴処理の研究
说话人识别中的本地说话人判别特征处理研究
基本信息
- 批准号:09F09805
- 负责人:
- 金额:$ 0.77万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2009
- 资助国家:日本
- 起止时间:2009 至 2010
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
(1)構造的MAP適応法の研究GMM (Gaussian-mixture model)とSVM (Support Vector Machine)を組み合わせて用いる話者認識法に、構造的MAP適応法(Structural MAP adaptation)を適用する方法について研究した。構造的MAP適応法を用いることにより、限られた量の学習データを効果的に用いて、頑健な話者モデルを推定することができる。種々の構成の木構造を用いて実験を行った結果、最適な構造を用いた場合、10-12%の話者認識性能の向上が達成できることが確認された。この方法に、特徴量空間の線形変換に基づくCMLLR法による話者適応学習(SAT : Speaker Adaptive Training)を組み合わせることにより、最適な木構造の選択が容易になることが確認できた。これらの成果は、国際会議論文として採録決定済みである。(2)個人差で重みづけられたMAP適応法の研究GMMとSVMを組み合わせる話者認識法において、話者識別基準(speaker-discriminative criterion)を導入することにより、認識性能の安定性を高める研究を行った。適応における重み係数を調整するためのデータ占有数に、Fisher discriminative ratioすなわち話者間・話者内分散比を用いることにより、7%の話者認識性能の向上が確認できた。この成果は、情報処理学会の音声言語処理シンポジウムで発表した。
(1)Research on Structural MAP Adaptation Method GMM (Gaussian-mixture model) and SVM (Support Vector Machine) are used in the research of speaker recognition method and structural MAP adaptation method. The MAP adaptation method of construction is used to estimate and limit the amount of learning. The results of the study showed that 10-12% of the participants 'cognitive performance was achieved when the optimal structure was used. This method is based on the linear transformation of feature space, CMLLR method, Speaker Adaptive Training (SAT), and the selection of optimal structure is easy. The results of international conferences and meetings are recorded in the journal. (2)A Study on GMM and SVM Group Method for Speaker Recognition and Speaker-discriminative Criterions Appropriate weight coefficient adjustment, number of participants, Fisher discriminative ratio, inter-speaker dispersion ratio, 7% of participants cognitive performance upward confirmation The results of this research are presented in the Speech Processing System of the Information Processing Society.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Optimal use of trees in structural MAP adaptation for speaker verification
树在结构 MAP 适应中的最佳使用以进行说话人验证
- DOI:
- 发表时间:2010
- 期刊:
- 影响因子:0
- 作者:Sangeeta Biswas;Marc Ferras;Koichi Shinoda;Sadaoki Furui
- 通讯作者:Sadaoki Furui
Inter-speaker weighted MAP adaptation for GMM-supervector speaker recognition
用于 GMM 超向量说话人识别的说话人间加权 MAP 自适应
- DOI:
- 发表时间:2010
- 期刊:
- 影响因子:0
- 作者:Marc Ferras;Koichi Shinoda;Sadaoki Furui
- 通讯作者:Sadaoki Furui
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
古井 貞熙其他文献
New Approach to Polyglot Synthesis: How to Speak any Language with Anyone's Voice
多语言合成的新方法:如何用任何人的声音说任何语言
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
岩野 公司;K. Iwano;古井 貞熙;S. Furui - 通讯作者:
S. Furui
Hybrid statistical and structural semantic modeling for Thai multi-stage spoken language understanding
泰语多阶段口语理解的混合统计和结构语义建模
- DOI:
- 发表时间:
2004 - 期刊:
- 影响因子:0
- 作者:
Takai T;Kato T;Yasueda H;Okumura K;Ogawa H.;古井 貞熙 - 通讯作者:
古井 貞熙
User identification using Time-of-Flight camera image streams
使用飞行时间相机图像流进行用户识别
- DOI:
- 发表时间:
2010 - 期刊:
- 影响因子:0
- 作者:
篠崎 隆宏;古井 貞煕;古井 貞熙 - 通讯作者:
古井 貞熙
古井 貞熙的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('古井 貞熙', 18)}}的其他基金
話し言葉音声認識のための言語モデルの研究
口语语音识别的语言模型研究
- 批准号:
02F00608 - 财政年份:2003
- 资助金额:
$ 0.77万 - 项目类别:
Grant-in-Aid for JSPS Fellows
音声認識を用いた日本語自律学習システムの開発
开发使用语音识别的自主日语学习系统
- 批准号:
13020211 - 财政年份:2001
- 资助金额:
$ 0.77万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas (A)
相似海外基金
識別的特徴抽出と確率モデルに基づく多様な環境・発声変動に頑健な音声認識
基于判别特征提取和概率模型的语音识别对不同环境和发声变化具有鲁棒性
- 批准号:
15K16020 - 财政年份:2015
- 资助金额:
$ 0.77万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
A Study on 'Tempo' ; for the Search on Bureaucratic System in Near-Modern Japan Providing Special Features of 'Bakuhan-State'
关于“节奏”的研究;
- 批准号:
09620011 - 财政年份:1997
- 资助金额:
$ 0.77万 - 项目类别:
Grant-in-Aid for Scientific Research (C)