Robust Speaker Recognition with Intra-Speaker Variability Compensation based on Long-Term Recorded Speech Corpus

基于长期录制语音语料库的具有说话人内部变异补偿的鲁棒说话人识别

基本信息

  • 批准号:
    21300060
  • 负责人:
  • 金额:
    $ 11.48万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
  • 财政年份:
    2009
  • 资助国家:
    日本
  • 起止时间:
    2009-04-01 至 2014-03-31
  • 项目状态:
    已结题

项目摘要

This research project aimed to build a new speech corpus that enables many researchers to investigate changes in human voices during a day, a month or several years, and to develop accurate and robust speaker recognition methods for industrial and forensic uses. The speech corpus named "AWA Long-Term Recorded Speech Corpus (AWA-LTR), which is released by Speech Resources Consortium of National Institute of Informatics (NII-SRC), consists of 6 speaker's read speech data recorded at morning, noon, and evening every week for several years (2 to 10 years). Using this corpus, we have developed intra-speaker variability compensation methods that improve the robustness of speaker recognition techniques. We also studied effective speech features for forensic speaker recognition, a comparison between human and machine speaker recognition abilities, accurate and robust speaker modeling methods and speaker verification methods.
该研究项目旨在建立一个新的语音语料库,使许多研究人员能够研究人类语音在一天,一个月或几年内的变化,并为工业和法医应用开发准确和强大的说话人识别方法。 由国家信息学研究所语音资源联合会(NII-SRC)发布的语音语料库名为“AWA长期录音语音语料库(AWA-LTR)”,包括数年(2至10年)每周在上午、中午和晚上记录的6个说话人的朗读语音数据。 使用这个语料库,我们已经开发了说话人内变异补偿方法,提高说话人识别技术的鲁棒性。 我们还研究了用于法医说话人识别的有效语音特征,人和机器说话人识别能力的比较,准确和鲁棒的说话人建模方法和说话人验证方法。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
小特集「話者認識に関する研究の動向」にあたって
关于特刊“说话人识别的研究动向”
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Bin Tong;Shao Hao;Bin-Hui Chou;Einoshin Suzuki;黒岩眞吾
  • 通讯作者:
    黒岩眞吾
エネルギー変化の線形予測符号化に基づくリズム特徴量を用いた音楽印象識別
基于能量变化的线性预测编码使用节奏特征进行音乐印象识别
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Susumu TAMAGAWA;Shinya SAKURAI;Takuya TEJIMA;Takeshi MORITA;Noriaki IZUMI;and Takahira YAMAGUCHI;三好真人
  • 通讯作者:
    三好真人
話者依存音声認識のための発音辞書・音響モデル適応手法
用于说话人相关语音识别的发音词典/声学模型自适应方法
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    森健太郎;柘植覚;伊藤桃代;福見稔
  • 通讯作者:
    福見稔
Speaker vector combination method of air- and bone-conduction speech for speaker identification
气导和骨导语音的说话人向量组合方法进行说话人识别
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Masafumi Nakao;Satoru Tsuge;Minoru Fukumi and Shingo Kuroiwa
  • 通讯作者:
    Minoru Fukumi and Shingo Kuroiwa
AWA長期間収録音声コーパスと時期差の分析
AWA长期录制语音语料库及时间差异分析
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    黒岩眞吾;柘植覚;張文彬;篠崎隆宏;堀内靖雄
  • 通讯作者:
    堀内靖雄
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

KUROIWA Shingo其他文献

KUROIWA Shingo的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('KUROIWA Shingo', 18)}}的其他基金

On the physical factors which makes the mother tongue dialogues smoothly - through the comparison with the non-mother tongue
论母语对话顺利的物理因素——通过与非母语的比较
  • 批准号:
    24650075
  • 财政年份:
    2012
  • 资助金额:
    $ 11.48万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
Analysis of Intra-Speaker Variation and Development of Distributed Speaker Recognition System
说话人内部变异分析及分布式说话人识别系统开发
  • 批准号:
    17300065
  • 财政年份:
    2005
  • 资助金额:
    $ 11.48万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A Study of Distributed Speaker Recognition Methods
分布式说话人识别方法研究
  • 批准号:
    14350204
  • 财政年份:
    2002
  • 资助金额:
    $ 11.48万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)

相似海外基金

深層学習に基づく話者認識システムの法科学利用に向けた信頼性の検証
验证基于深度学习的说话人识别系统在法医科学应用中的可靠性
  • 批准号:
    24K07957
  • 财政年份:
    2024
  • 资助金额:
    $ 11.48万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
人工音声による話者認識器詐称防止に関する研究
利用人工语音预防说话人识别器欺骗的研究
  • 批准号:
    19K11975
  • 财政年份:
    2019
  • 资助金额:
    $ 11.48万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
話者認識のための局所話者識別的特徴処理の研究
说话人识别中的本地说话人判别特征处理研究
  • 批准号:
    09F09805
  • 财政年份:
    2009
  • 资助金额:
    $ 11.48万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
科学捜査に対応したテキスト依存型自動話者認識システム(FASR)に関する研究
用于法医调查的文本相关自动说话人识别系统(FASR)的研究
  • 批准号:
    20921016
  • 财政年份:
    2008
  • 资助金额:
    $ 11.48万
  • 项目类别:
    Grant-in-Aid for Encouragement of Scientists
実世界環境下における遠隔発話の音声認識と話者認識およびインデックス化に関する研究
现实环境中的语音识别、说话人识别和远程语音索引研究
  • 批准号:
    19650040
  • 财政年份:
    2007
  • 资助金额:
    $ 11.48万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
複数のバイオメトリクス個人情報を利用したロバストな話者認識手法に関する研究
利用多种个人生物特征信息的鲁棒说话人识别方法研究
  • 批准号:
    14780274
  • 财政年份:
    2002
  • 资助金额:
    $ 11.48万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
3次元声道モデルと音声の並列分散処理による個人性情報の抽出と対話型話者認識
使用 3D 声道模型和并行分布式语音处理提取个人信息和交互式说话人识别
  • 批准号:
    04750366
  • 财政年份:
    1992
  • 资助金额:
    $ 11.48万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
音声生成過程での特徴とニューラルネットワークを用いた話者認識システムの開発
利用语音生成过程和神经网络中的特征开发说话人识别系统
  • 批准号:
    01780057
  • 财政年份:
    1989
  • 资助金额:
    $ 11.48万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了