JFA for text-dependent speaker verification
JFA 用于文本相关的说话人验证
基本信息
- 批准号:462115-2013
- 负责人:
- 金额:$ 4.3万
- 依托单位:
- 依托单位国家:加拿大
- 项目类别:Collaborative Research and Development Grants
- 财政年份:2015
- 资助国家:加拿大
- 起止时间:2015-01-01 至 2016-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
VoiceTrust needs to be able to authenticate speakers using utterances of short duration (1-2 seconds). Their applications require a technology which is robust to channel effects (so that, for example, speakers can use different handsets at enrollment and verification time). Furthermore this robustness needs to be achieved using modest amounts of data for classifier training. To satisfy the duration constraint, speaker verification needs to be ``text-dependent'' (that is, based on passphrases). This precludes the use of state of the art methods of text-independent methods of speaker verification and, in particular, the i-vector/PLDA approach.
We propose to satisfy VoiceTrust's requirements by developing a version of Joint Factor Analysis (JFA, the predecessor of i-vector/PLDA) which is tailored to the text-dependent speaker recognition problem and which can be trained with modest amounts of data. We will develop two solutions to the problem, one designed to handle the case where background data for modeling passphrases is available and the other to handle the general case. (The technical challenge is greater in the general case but success here would relieve VoiceTrust of the burden of collecting data.) To achieve robustness to additive background noise and reverberation we will develop several acoustic feature extractors and train a JFA back end in each case (so that there will be one classifier for each front end). Scores produced by these classifiers will be fused by logistic regression to make speaker verification decisions. Finally VoiceTrust is particularly concerned that speaker recognition technology is vulnerable to spoofing attacks by speech synthesis and voice conversion technology. We will create synthetic datasets and use them to train JFA-like statistical models of synthesis and voice conversion artifacts in order to detect spoofing attacks.
This technology will be integrated into currently existing VoiceTrust products, VT-Athena and VT-Aura.
VoiceTrust需要能够使用短持续时间(1-2秒)的话语对说话者进行身份验证。它们的应用需要一种对信道效应具有鲁棒性的技术(例如,发言者可以在注册和验证时使用不同的手机)。 此外,这种鲁棒性需要使用适量的数据进行分类器训练来实现。为了满足持续时间限制,说话者验证需要“依赖于文本”(即基于密码短语)。 这排除了使用说话者验证的文本无关方法的现有技术方法,特别是i向量/PLDA方法。
我们建议通过开发一个版本的联合因子分析(JFA,i-向量/PLDA的前身),这是专为文本相关的说话人识别问题,它可以用适量的数据进行训练,以满足VoiceTrust的要求。 我们将开发两种解决方案来解决这个问题,一种设计用于处理有用于建模密码短语的背景数据的情况,另一种设计用于处理一般情况。(The在一般情况下,技术挑战更大,但这里的成功将减轻VoiceTrust收集数据的负担。)为了实现对加性背景噪声和混响的鲁棒性,我们将开发几个声学特征提取器,并在每种情况下训练JFA后端(因此每个前端都有一个分类器)。这些分类器产生的分数将通过逻辑回归进行融合,以做出说话人确认决策。 最后,VoiceTrust特别关注说话人识别技术容易受到语音合成和语音转换技术的欺骗攻击。我们将创建合成数据集,并使用它们来训练类似JFA的合成和语音转换工件的统计模型,以检测欺骗攻击。
该技术将集成到当前现有的VoiceTrust产品VT-Athena和VT-Aura中。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Kenny, Patrick其他文献
Real-time expression of affect through respiration
- DOI:
10.1002/cav.349 - 发表时间:
2010-05-01 - 期刊:
- 影响因子:1.1
- 作者:
de Melo, Celso M.;Kenny, Patrick;Gratch, Jonathan - 通讯作者:
Gratch, Jonathan
Modeling prosodic features with joint factor analysis for speaker verification
- DOI:
10.1109/tasl.2007.902758 - 发表时间:
2007-09-01 - 期刊:
- 影响因子:0
- 作者:
Dehak, Najim;Dumouchel, Pierre;Kenny, Patrick - 通讯作者:
Kenny, Patrick
A study of interspeaker variability in speaker verification
- DOI:
10.1109/tasl.2008.925147 - 发表时间:
2008-07-01 - 期刊:
- 影响因子:0
- 作者:
Kenny, Patrick;Ouellet, Pierre;Dumouchel, Pierre - 通讯作者:
Dumouchel, Pierre
Joint factor analysis versus eigenchannels in speaker recognition
- DOI:
10.1109/tasl.2006.881693 - 发表时间:
2007-05-01 - 期刊:
- 影响因子:0
- 作者:
Kenny, Patrick;Boulianne, Gilles;Dumouchel, Pierre - 通讯作者:
Dumouchel, Pierre
Effect of body mass index on functional outcome in primary total knee arthroplasty - a single institution analysis of 2180 primary total knee replacements
- DOI:
10.5312/wjo.v7.i10.664 - 发表时间:
2016-10-18 - 期刊:
- 影响因子:1.9
- 作者:
O'Neill, Shane C.;Butler, Joseph S.;Kenny, Patrick - 通讯作者:
Kenny, Patrick
Kenny, Patrick的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Kenny, Patrick', 18)}}的其他基金
Representations of Speech Dynamics as Features for Speaker Recognition
语音动力学的表示作为说话人识别的特征
- 批准号:
105523-2012 - 财政年份:2015
- 资助金额:
$ 4.3万 - 项目类别:
Discovery Grants Program - Individual
Representations of Speech Dynamics as Features for Speaker Recognition
语音动力学的表示作为说话人识别的特征
- 批准号:
105523-2012 - 财政年份:2014
- 资助金额:
$ 4.3万 - 项目类别:
Discovery Grants Program - Individual
JFA for text-dependent speaker verification
JFA 用于文本相关的说话人验证
- 批准号:
462115-2013 - 财政年份:2014
- 资助金额:
$ 4.3万 - 项目类别:
Collaborative Research and Development Grants
Representations of Speech Dynamics as Features for Speaker Recognition
语音动力学的表示作为说话人识别的特征
- 批准号:
105523-2012 - 财政年份:2013
- 资助金额:
$ 4.3万 - 项目类别:
Discovery Grants Program - Individual
Representations of Speech Dynamics as Features for Speaker Recognition
语音动力学的表示作为说话人识别的特征
- 批准号:
105523-2012 - 财政年份:2012
- 资助金额:
$ 4.3万 - 项目类别:
Discovery Grants Program - Individual
Speaker and session variability in speech processing
语音处理中的说话者和会话可变性
- 批准号:
105523-2007 - 财政年份:2011
- 资助金额:
$ 4.3万 - 项目类别:
Discovery Grants Program - Individual
Découpage en nouvelles de bulletins télévisés
电视公告中的剪纸
- 批准号:
417255-2011 - 财政年份:2011
- 资助金额:
$ 4.3万 - 项目类别:
Engage Grants Program
Speaker and session variability in speech processing
语音处理中的说话者和会话可变性
- 批准号:
105523-2007 - 财政年份:2010
- 资助金额:
$ 4.3万 - 项目类别:
Discovery Grants Program - Individual
Speaker and session variability in speech processing
语音处理中的说话者和会话可变性
- 批准号:
105523-2007 - 财政年份:2009
- 资助金额:
$ 4.3万 - 项目类别:
Discovery Grants Program - Individual
TV and radio advertisement detection (Phase 1 application)
电视广播广告检测(第一期应用)
- 批准号:
380721-2009 - 财政年份:2009
- 资助金额:
$ 4.3万 - 项目类别:
Idea to Innovation
相似国自然基金
J-TEXT托卡马克上边界湍流与撕裂模相互作用的实验研究
- 批准号:12375223
- 批准年份:2023
- 资助金额:54 万元
- 项目类别:面上项目
J-TEXT装置外加三维磁场主动调控偏滤器脱靶的实验研究
- 批准号:12305243
- 批准年份:2023
- 资助金额:20 万元
- 项目类别:青年科学基金项目
J-TEXT托卡马克装置上多模式磁扰动对逃逸电流影响研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
J-TEXT托卡马克上边界湍流特性对高密度运行影响的实验研究
- 批准号:11905080
- 批准年份:2019
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
关于J-TEXT托卡马克上微撕裂模电磁湍流及其输运的实验研究
- 批准号:11605067
- 批准年份:2016
- 资助金额:19.0 万元
- 项目类别:青年科学基金项目
基于J-TEXT远红外偏振干涉仪的相干散射与密度扰动的实验研究
- 批准号:11575067
- 批准年份:2015
- 资助金额:64.0 万元
- 项目类别:面上项目
J-TEXT上外加磁扰动抑制等离子体破裂下逃逸电子产生的实验研究
- 批准号:11275079
- 批准年份:2012
- 资助金额:80.0 万元
- 项目类别:面上项目
J-TEXT托卡马克等离子体粒子输运的密度调制实验研究
- 批准号:11105056
- 批准年份:2011
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
相似海外基金
LINK-IT: Leveraging vIdeos and commuNity health worKers to address socIal determinants of health in immigranTs
LINK-IT:利用视频和社区卫生工作者解决移民健康的社会决定因素
- 批准号:
10736695 - 财政年份:2023
- 资助金额:
$ 4.3万 - 项目类别:
MRWeight: Medical Residents Learning Weight Management Counseling Skills -- A Multi-Modal, Technology-Assisted, Spaced Education Program
MRWeight:住院医生学习体重管理咨询技能——多模式、技术辅助、间隔教育计划
- 批准号:
10561356 - 财政年份:2023
- 资助金额:
$ 4.3万 - 项目类别:
Role of Pcpe2 in Adipose Tissue Remodeling and Lipoprotein Metabolism
Pcpe2 在脂肪组织重塑和脂蛋白代谢中的作用
- 批准号:
10837655 - 财政年份:2023
- 资助金额:
$ 4.3万 - 项目类别:
Mobile technologies to screen for prediabetes and type 2 diabetes in asymptomatic adults
用于筛查无症状成人糖尿病前期和 2 型糖尿病的移动技术
- 批准号:
10660714 - 财政年份:2023
- 资助金额:
$ 4.3万 - 项目类别:
Futuros Fuertes 2.0: A primary care-based intervention to prevent obesity in low-income Latino children
Futuros Fuertes 2.0:预防低收入拉丁裔儿童肥胖的初级保健干预措施
- 批准号:
10656765 - 财政年份:2023
- 资助金额:
$ 4.3万 - 项目类别:
The "dark immunopeptidome" as a source of CD8 T cell epitopes in type 1 diabetes
“暗免疫肽组”作为 1 型糖尿病 CD8 T 细胞表位的来源
- 批准号:
10589465 - 财政年份:2023
- 资助金额:
$ 4.3万 - 项目类别:
Smart Walk: A culturally tailored smartphone-delivered physical activity intervention to reduce cardiometabolic disease risk among African American women
Smart Walk:一种根据文化定制的智能手机提供的身体活动干预措施,以降低非裔美国女性的心脏代谢疾病风险
- 批准号:
10639951 - 财政年份:2023
- 资助金额:
$ 4.3万 - 项目类别:
REACH-Es: Adapting a digital health tool to improve diabetes medication adherence among Latino adults
REACH-E:采用数字健康工具来提高拉丁裔成年人糖尿病药物的依从性
- 批准号:
10641103 - 财政年份:2023
- 资助金额:
$ 4.3万 - 项目类别:
A culturally-tailored dietary trial for cardiometabolic health in Puerto Rico
波多黎各心脏代谢健康的文化定制饮食试验
- 批准号:
10718150 - 财政年份:2023
- 资助金额:
$ 4.3万 - 项目类别:
Treating early type 2 diabetes by reducing postprandial glucose excursions: A paradigm shift in lifestyle modification
通过减少餐后血糖波动来治疗早期 2 型糖尿病:改变生活方式的范式转变
- 批准号:
10517020 - 财政年份:2022
- 资助金额:
$ 4.3万 - 项目类别: