音素の精密な特徴抽出に基づいた音声認識方法の研究

基于音素精确特征提取的语音识别方法研究

基本信息

  • 批准号:
    63608504
  • 负责人:
  • 金额:
    $ 0.96万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
  • 财政年份:
    1988
  • 资助国家:
    日本
  • 起止时间:
    1988 至 无数据
  • 项目状态:
    已结题

项目摘要

1.音響処理機構の研究に関して。線形予測分析法の分析次数を変更したときの判別率を破裂子音、鼻子音について求めた。その結果、破裂子音については17次以下では認識率が低くなるが、17次以上に増やしてもあまり改善されない。鼻子音については19次が最適であった。聴覚フィルターモデルをシミュレートするプログラムの開発を行なった。このモデルを用いた子音の判別率について今後実験を行なう予定である。2.調音事象の自動検出に関して。当初考えていたエキスパートシステムの手法と並行して、ニューラル・ネットによる手法について試み、音声パワーの傾斜係数および、LPCスペクトルを入力とするとき、未学習話者の有声破裂子音に関して/b/および/d/では100%、/g/については92%が±3ms以内の精度で検出できた。3.弁別的特徴の自動認識への適用に関して。本年度は音響音声変換に弁別素性レベルを導入することについて、新しい素性モデルを提案した。このモデルは、音素、異音、素性、音響パラメータの各レベルを導入する。音響パラメータの有限個のメンバーは階層構造を成し、発話時に生起する代償作用をある程度予測する。素性は複数の音響パラメータの部分集合から成る。人間の聴覚機構の特性に基づいて、素性間に階層構造を設定し、音韻環境によって異音に生起する素性の脱落をある程度予測する。素性は音素ではなく異音と多対多の対応関係にあるとする。4.音素の特徴の言語間の非核に関して。破裂子音/p,t,k,b,d,g/を対象として破裂の位置や強さ、ホルマント等スペクトログラムから抽出できる音響的特徴について日仏二か国語間で対照を行なった。日本語と対応するフランス語の音節の特徴のほとんどが共通であることが分かった。しかし、日本語で欠落している「チ、ツ、ヂ(ジ)、ヅ(ズ)」に対応した歯茎音/t,d/の特徴の相違は顕著に認められた。
1. Research on sound processing mechanism. The number of analysis times of linear prediction analysis method is changed to determine the discriminant rate of broken consonant and nasal consonant. As a result, the recognition rate of broken tones is lower than 17 times, and the recognition rate is higher than 17 times. Nose sound 19 times the most appropriate. The development of the new system is a matter of urgency. The discriminant rate of the consonant in the future is determined. 2. Automatic detection of tuning events is relevant. The method of initial examination is to test the accuracy of sound, tilt coefficient of sound, LPC selection, input force of unlearned speaker's sound break, and accuracy of sound break within 100% and 92% ±3ms. 3. The automatic recognition of the characteristics of a category is relevant to its application. This year, the sound quality of the sound is changed, and the new quality of the sound is changed. The introduction of each of the following elements: phoneme, heterophone, prime, and sound. The limited number of speakers in the audio space can be hierarchically structured to predict the degree of compensation that occurs during speech. The number of elements in the complex is equal to the number of elements in the complex. The basic structure of the human body, the hierarchical structure of the primes, the prediction of the degree of the primes generated by the phonological environment The relationship between primes and phonemes 4. Non-nuclear correlation between phoneme features and speech. The breaking tones/p,t,k,b,d,g/correspond to the breaking position, strong, strong, The characteristics of Japanese syllables are common. In Japanese,",(),()" is the opposite of the original sound/t,d/.

项目成果

期刊论文数量(16)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
M.Dantsuji: A bstracts of the Sixth Int.Phonology heeting. 25. 25 (1988)
M.Dantsuji:第六届国际音系学会议摘要。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
北澤、児島、堂下: 電子情報通信学会論文誌. J72-4. 41-48 (1989)
Kitazawa、Kojima、Doshita:电子、信息和通信工程师协会学报 J72-48 (1989)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
S.Kitazawa;M.Fourati;S.Ichikawa: J.ASA. Sup.184. S59 (1988)
S.Kitazawa;M.Fourati;S.Ichikawa:J.ASA。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
北澤: 電子情報通信学会 音声研究会資料. SP88-32. 9-16 (1988)
北泽:IEICE 语音研究组材料 SP88-32 (1988)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
S.Kitazawa;J.P.Tuback: Proc.9th ICPR. 1988. (1077-1079)
S.Kitazawa;J.P.Tuback:Proc.9th ICPR。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

北澤 茂良其他文献

発話行動のマルチモーダル記述による幼児の発達過程観察(コミュニケーション・対話,第9回音声言語シンポジウム)
使用言语行为的多模态描述观察幼儿的发展过程(沟通/对话,第九届口语研讨会)
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    笠見 朋彦;桐山 伸也;竹林 洋一;北澤 茂良
  • 通讯作者:
    北澤 茂良

北澤 茂良的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('北澤 茂良', 18)}}的其他基金

聴覚モデルに基づく新しい人工内耳による音声・音楽信号処理の研究
基于听觉模型的新型人工耳蜗的语音和音乐信号处理研究
  • 批准号:
    21650036
  • 财政年份:
    2009
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
聴覚モデルに基づく新しい人工内耳の音声・音楽情報処理の研究
基于听觉模型的新型人工耳蜗语音和音乐信息处理研究
  • 批准号:
    19650038
  • 财政年份:
    2007
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
聴覚モデルに基づく新しい人工内耳システムの研究
基于听觉模型的新型人工耳蜗系统研究
  • 批准号:
    17650049
  • 财政年份:
    2005
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
人工内耳のスピーチプロセッサのための新しい信号処理方式の評価
人工耳蜗语音处理器新信号处理方法的评估
  • 批准号:
    04F04287
  • 财政年份:
    2004
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
韻律コーパスとその作成自動化
韵律语料库及其创建的自动化
  • 批准号:
    12132204
  • 财政年份:
    2000
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
聴覚末梢系の生理モデルに基づく新しい人工内耳システムの研究
基于听觉外围系统生理模型的新型人工耳蜗系统研究
  • 批准号:
    06680351
  • 财政年份:
    1994
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
音素の精密な特徴抽出に基づいた音声認識方法の研究
基于音素精确特征提取的语音识别方法研究
  • 批准号:
    62608502
  • 财政年份:
    1987
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
日本語無声破裂子音の破裂区間の特徴の抽出に関する研究
日语清爆破辅音爆破音程特征提取研究
  • 批准号:
    X00210----575230
  • 财政年份:
    1980
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

脳神経疾患による構音障害を克服するための,音声認識および音声合成AIシステムの開発
开发语音识别与语音合成AI系统,克服脑神经疾病引起的构音障碍
  • 批准号:
    24K10630
  • 财政年份:
    2024
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
画像認識と音声認識の複合AIによる災害状況認識ユニットの基礎研究
图像识别与语音识别相结合的AI灾情识别单元基础研究
  • 批准号:
    23K23017
  • 财政年份:
    2024
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
画像・音声認識と料理データベースによる食事記録システム開発、及び疫学研究での応用
基于图像/语音识别和烹饪数据库的用餐记录系统的开发及其在流行病学研究中的应用
  • 批准号:
    23K20170
  • 财政年份:
    2024
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
非母語話者のスマートフォン音声認識機能での誤認識傾向を考慮した発音学習システム
使用智能手机语音识别功能,考虑到非母语人士的误识别倾向的发音学习系统。
  • 批准号:
    24K06231
  • 财政年份:
    2024
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
自動音声認識を利用したbilingual speech-to-textシステム構築と授業分析への応用
自动语音识别双语语音转文本系统的构建及其在课程分析中的应用
  • 批准号:
    24K04125
  • 财政年份:
    2024
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
実用性の高いEnd-to-End音声認識に向けた研究
高实用性端到端语音识别研究
  • 批准号:
    22KJ2898
  • 财政年份:
    2023
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
音声認識のデータ拡張のための音声合成との密統合
与语音合成紧密集成,用于语音识别的数据增强
  • 批准号:
    23K16944
  • 财政年份:
    2023
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
画像認識と音声認識の複合AIによる災害状況認識ユニットの基礎研究
图像识别与语音识别相结合的AI灾情识别单元基础研究
  • 批准号:
    22H01749
  • 财政年份:
    2022
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
日常生活音を活用した構音障害者のための音響監視および音声認識システムの研究
使用日常声音对构音障碍患者进行声学监测和语音识别系统的研究
  • 批准号:
    22K12168
  • 财政年份:
    2022
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
自動音声認識と機械学習による新たな医学教育システムの創出
使用自动语音识别和机器学习创建新的医学教育系统
  • 批准号:
    22K10459
  • 财政年份:
    2022
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了