骨導音声を用いた話者識別システムに関する研究
骨导语音说话人识别系统研究
基本信息
- 批准号:14750288
- 负责人:
- 金额:$ 1.73万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Young Scientists (B)
- 财政年份:2002
- 资助国家:日本
- 起止时间:2002 至 2004
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本年度得られた研究成果は以下の通りである。1.気導音声と骨導音声の収録日本語5母音、及び単語音声(数字)発声時の気導音声と骨導音声の収録を、防音室内で、新たに成人12名に対して行った。また、防音室内で電子協騒音データベースDATの駅構内騒音を再生し、同様の収録を行うことで、雑音環境下音声データを作成した。2.話者識別実験本年度は、日本語5母音発声時の気導音声と骨導音声の対数パワースペクトルの差を特徴量として用いて話者識別実験を行い、詳細な検討を行った。クリーンな(雑音環境でない)環境下で収録した音声に対して話者識別実験を行ったところ、話者12名に対して99.2%の識別率が得られた。また、特徴量として対数パワースペクトルの代わりにケプストラム係数を用いて同様の実験を行ったところ、話者12名に対して100%の識別率が得られた。(昨年度は、話者10名に対して93.0%。一昨年度は、エネルギー比のみを特徴量として話者10名に対して85.0%)さらに、いずれの場合においても、気導音声のみを用いた場合よりも雑音耐性が高いことを確認した。3.裏声の判別と歌声の評価声帯振動が明らかに異なるにも関わらず、特に女性において聴感上判別が困難であるばかりでなく本人も認識していないことがあると言われている裏声を骨導音声の歪み率から判別し、表声-裏声換声点の検出を試みた。その結果、骨導音声の歪み率から換声点の検出が可能であることが明らかとなった。また、骨導音声の歪み率を話者識別の特徴量として用いることによって話者識別率の向上が期待できることが明らかとなった。さらに、気導音声から音楽的声域の評価を行い、客観的に「正しい発声」を自動判定するボイストレーナへの応用について検討を行った結果、有効性が確認出来た。
This year's research results are as follows: 1. Japanese 5 vowels, and Japanese 6 vowels, and Japanese 7 vowels, and Japanese 8 vowels, and Japanese 9 vowels. The sound reproduction in the structure of the electronic coordination system in the soundproof room, the sound reproduction in the soundproof environment, and the sound reproduction in the soundproof environment 2. This year's speaker identification is conducted in the middle of the year, and detailed discussion is conducted on the number of voice and bone voice pairs in the vowel generation. The recognition rate of 99.2% was obtained for 12 speakers under the condition of recording in the audio environment. The recognition rate of 100% was obtained by using the same method of implementation as that of 12 speakers. (Last year, 10 respondents answered 93.0%.) Last year, the number of people with high voice resistance was 85.0%. 3. It is difficult to distinguish the inner sound from the outer sound, especially the inner sound, and the outer sound from the inner sound. The result is that the sound of the bone is cold and the sound is distorted. The sound of the sound is changed. The sound is changed. The feature quantity of speaker recognition is used in the process of speaker recognition. The evaluation of the sound field of the sound field is carried out, and the "positive sound" of the guest is automatically determined. The result of the examination is confirmed.
项目成果
期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
槙本由希, 森 幹男, 谷口秀次: "骨導音声を用いた話者識別に関する研究"平成15年度電気関係学会北陸支部連合大会講演論文集. 119 (2003)
Yuki Makimoto、Mikio Mori、Hidetsugu Taniguchi:“利用骨传导声音进行说话人识别的研究”2003 年日本电气工程师北陆分会会议记录 119 (2003)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
槙本由希, 森 雅昭, 森 幹男, 谷口秀次: "骨導音声の分析と話者識別への応用"平成14年度電気関係学会北陸支部連合大会講演論文集. 130 (2002)
Yuki Makimoto、Masaaki Mori、Mikio Mori、Hidetsugu Taniguchi:“骨传导语音分析及其在说话人识别中的应用”2002 年日本电气工程师北陆分会会议记录 130 (2002)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
大久保真治, 森 幹男, 谷口秀次, 木戸崇志: "話者識別方式の検討"平成14年度電気関係学会北陸支部連合大会講演論文集. 135 (2002)
Shinji Okubo,Mikio Mori,Hidetsugu Taniguchi,Takashi Kido:“说话人识别方法的研究”2002年电气工程学会北陆分会会议记录135(2002)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
森 幹男其他文献
高音質補聴器のための骨導音を併用した受聴音質の検討
使用骨传导声音检查高质量助听器的接收声音质量
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
春名隆陽;荻原慎洋;森 幹男;谷口秀次;高橋謙三 - 通讯作者:
高橋謙三
Effects of Increase in Laryngeal Cross-sectional Area on Vocal Tract Characteristics in Human Whistling
喉部横截面积的增加对人类口哨声道特征的影响
- DOI:
10.1541/ieejfms.140.304 - 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
森 幹男;福田 紗希 - 通讯作者:
福田 紗希
Analyzing the bass whistling method using a vocal tract model
使用声道模型分析低音吹口哨方法
- DOI:
10.20697/jasj.78.11_622 - 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
谷出 健一;森 幹男 - 通讯作者:
森 幹男
Frequency Response of the Vocal Tract Considering the Glottis Opening Area During Human Whistling
考虑人类吹口哨时声门开口区域的声带频率响应
- DOI:
10.1541/ieejfms.140.23 - 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
森 幹男;福田 紗希;森 幹男,福田 紗希 - 通讯作者:
森 幹男,福田 紗希
森 幹男的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('森 幹男', 18)}}的其他基金
口笛原理の解明による誰でもプロ並みに口笛を吹ける最適口笛吹鳴法の確立
通过阐明吹口哨原理,建立任何人都可以像专业人士一样吹口哨的最佳吹口哨方法
- 批准号:
22K02912 - 财政年份:2022
- 资助金额:
$ 1.73万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
相似海外基金
Person-specific automatic speaker recognition: understanding the behaviour of individual speakers for applications of ASR
特定于人的自动说话人识别:了解单个说话人的行为以用于 ASR 的应用
- 批准号:
ES/W001241/1 - 财政年份:2022
- 资助金额:
$ 1.73万 - 项目类别:
Research Grant
Humans and machines: novel methods for testing speaker recognition performance
人类和机器:测试说话人识别性能的新方法
- 批准号:
AH/T012978/1 - 财政年份:2021
- 资助金额:
$ 1.73万 - 项目类别:
Research Grant
The effects of speaker individuality on voice disguise and speaker recognition in application to forensic speech science
说话人个性对语音伪装和说话人识别的影响在法医语音科学中的应用
- 批准号:
2385933 - 财政年份:2020
- 资助金额:
$ 1.73万 - 项目类别:
Studentship
Towards linguistically-informed automatic speaker recognition
迈向基于语言的自动说话人识别
- 批准号:
2279775 - 财政年份:2019
- 资助金额:
$ 1.73万 - 项目类别:
Studentship
Representations of Speech Dynamics as Features for Speaker Recognition
语音动力学的表示作为说话人识别的特征
- 批准号:
105523-2012 - 财政年份:2015
- 资助金额:
$ 1.73万 - 项目类别:
Discovery Grants Program - Individual
RI: Medium: Collaborative Research: Understanding Individual-Level Speech Variability: From Novel Articulatory Data to Robust Speaker Recognition
RI:媒介:协作研究:了解个体层面的语音变异性:从新颖的发音数据到强大的说话人识别
- 批准号:
1514544 - 财政年份:2015
- 资助金额:
$ 1.73万 - 项目类别:
Continuing Grant
Representations of Speech Dynamics as Features for Speaker Recognition
语音动力学的表示作为说话人识别的特征
- 批准号:
105523-2012 - 财政年份:2014
- 资助金额:
$ 1.73万 - 项目类别:
Discovery Grants Program - Individual
Fundamental Frequency Detection Utilizing Air and Bone Conducted Speeches and Its Application to Speaker Recognition
气导和骨导语音基频检测及其在说话人识别中的应用
- 批准号:
26330187 - 财政年份:2014
- 资助金额:
$ 1.73万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
The next generation speaker recognition system
下一代说话人识别系统
- 批准号:
LP130100110 - 财政年份:2013
- 资助金额:
$ 1.73万 - 项目类别:
Linkage Projects
Representations of Speech Dynamics as Features for Speaker Recognition
语音动力学的表示作为说话人识别的特征
- 批准号:
105523-2012 - 财政年份:2013
- 资助金额:
$ 1.73万 - 项目类别:
Discovery Grants Program - Individual