音素の精密な特徴抽出に基づいた音声認識方法の研究

基于音素精确特征提取的语音识别方法研究

基本信息

  • 批准号:
    62608502
  • 负责人:
  • 金额:
    $ 0.64万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
  • 财政年份:
    1987
  • 资助国家:
    日本
  • 起止时间:
    1987 至 无数据
  • 项目状态:
    已结题

项目摘要

1.音声の音響処理と音素の特徴抽出 基本周派数間隔標本化に基づく音声パワー, スペクトル包絡分析法によって子音のスペクトル分析を行った. 線形予測分析と比較して, 特に, 鼻子音の場合に認識精度が向上することを確認した.2.音素の特徴の統計処理と特徴の抽出 より厳密に定義したセグメンテーションとして調音事象の自動抽出を行った. 我々は次の3方式を試みた. (1)知識光学的手法に基づく方式 仮定(破裂子音, 鼻子音など)をたて, その仮定の証明を試みる. 試行錯誤の結果得られた知識を順次付加し, 知識を体系化したり修正したりする. このための枠組みは, Prolog言語のバック・トラック機構を利用して実現している. (2)音声波形から得られた規則に基づく方式 視察によって破裂時点を決定する過程を規則として記述することを試みている. ここで抽出した規則を適用したときの有効性を評価した. (3)学習に基づく方式 短時間パワーの変化の時系列を入力して与えたときに破裂時点で出力するニューラルネットワークを構成した.3.音素の識別理論の構築 多群パターンの認識で, すべての対について2群間の識別を行い, この結果を用いて多群への識別を行なう認識方法をすでに提案している. この対識別の理論のなかでの変数選択の効果と無効な対識別が最終結果に及ぼす影響について考察した. こうしてミニマックス法を用いることの根拠を明らかにすることができた.4.音素識別機構の簡略化 我々は, 手軽に高精度の音声入出力が行なえる装置としてPCMプロセッサとパーソナルコンピュータを接続した実時間音声入出力システムを製作した. 音声信号処理の高速化のためにパーソナルコンピュータと接続できるディジタル・シグナル・プロセッサ・ボードを開発した.
1. Sound processing and phoneme feature extraction are performed by using the envelope analysis method. 2. Statistical processing of phoneme features and extraction of phoneme features. 3. Automatic extraction of phoneme features. 3 ways to try it. (1)Knowledge of optical techniques is based on the method of determination (cracking sound, nose sound). The results of the trial were obtained by adding knowledge to the system. This is the first time that a Prolog language has been used. (2)The sound wave shape is based on the inspection of the sound wave shape. The rules apply. (3)3. Phoneme recognition theory and construction of multi-group recognition, and the results of this study are proposed for multi-group recognition. The theory of identification and the effect of the selection of numbers are investigated. 4. Simplifying the phoneme recognition mechanism, manually adjusting the input force of high-precision sound, and making the input force of sound. Sound signal processing speed up the development of sound transmission

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
野々山 秀文 北澤茂良: 日本音響学会講演論文集. (1988)
野山秀文和北泽茂:日本声学学会会刊(1988)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Shigeyoshi Kitazawa and J.P.Tubach: Proc. of Eupecon Conferance on Sperch Technology. 91-94 (1987)
Shigeyoshi Kitazawa 和 J.P.Tubach:Proc。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
北澤茂良: 音声言語. 2. 89-97 (1987)
北泽茂:口语。2. 89-97 (1987)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Shigeyoshi Kitazawa: STUDIA PHONOLOGICA. XXI. 72-79 (1987)
北泽茂吉:音系研究室。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
野々山 秀文 北澤茂良: 日本音響学会講演論文集. 91-92 (1987)
Hidefumi Nonoyama 和 Shigeru Kitazawa:日本声学学会会议记录 91-92 (1987)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

北澤 茂良其他文献

発話行動のマルチモーダル記述による幼児の発達過程観察(コミュニケーション・対話,第9回音声言語シンポジウム)
使用言语行为的多模态描述观察幼儿的发展过程(沟通/对话,第九届口语研讨会)
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    笠見 朋彦;桐山 伸也;竹林 洋一;北澤 茂良
  • 通讯作者:
    北澤 茂良

北澤 茂良的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('北澤 茂良', 18)}}的其他基金

聴覚モデルに基づく新しい人工内耳による音声・音楽信号処理の研究
基于听觉模型的新型人工耳蜗的语音和音乐信号处理研究
  • 批准号:
    21650036
  • 财政年份:
    2009
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
聴覚モデルに基づく新しい人工内耳の音声・音楽情報処理の研究
基于听觉模型的新型人工耳蜗语音和音乐信息处理研究
  • 批准号:
    19650038
  • 财政年份:
    2007
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
聴覚モデルに基づく新しい人工内耳システムの研究
基于听觉模型的新型人工耳蜗系统研究
  • 批准号:
    17650049
  • 财政年份:
    2005
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
人工内耳のスピーチプロセッサのための新しい信号処理方式の評価
人工耳蜗语音处理器新信号处理方法的评估
  • 批准号:
    04F04287
  • 财政年份:
    2004
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
韻律コーパスとその作成自動化
韵律语料库及其创建的自动化
  • 批准号:
    12132204
  • 财政年份:
    2000
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
聴覚末梢系の生理モデルに基づく新しい人工内耳システムの研究
基于听觉外围系统生理模型的新型人工耳蜗系统研究
  • 批准号:
    06680351
  • 财政年份:
    1994
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
音素の精密な特徴抽出に基づいた音声認識方法の研究
基于音素精确特征提取的语音识别方法研究
  • 批准号:
    63608504
  • 财政年份:
    1988
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
日本語無声破裂子音の破裂区間の特徴の抽出に関する研究
日语清爆破辅音爆破音程特征提取研究
  • 批准号:
    X00210----575230
  • 财政年份:
    1980
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

Research and Production of a Manual on English Phoneme Recognition for International Students
留学生英语音素识别手册的研究与制作
  • 批准号:
    23K12201
  • 财政年份:
    2023
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
A Study for Utilizing the Linguistic Information in Phoneme Recognition to Understand Continuous Speech
利用音素识别中的语言信息来理解连续语音的研究
  • 批准号:
    03452173
  • 财政年份:
    1991
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (B)
Research On Speech Production Model and Phoneme Recognition Using Cooperative Problem Solvers
使用协作问题解决器的语音产生模型和音素识别研究
  • 批准号:
    01580036
  • 财政年份:
    1989
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
Phoneme Recognition System
音素识别系统
  • 批准号:
    8860645
  • 财政年份:
    1989
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Standard Grant
調音結合正規化のための特徴の時間重み付けと時間変化形状による音素認識の研究
利用特征时间加权和时变形状进行发音组合归一化的音素识别研究
  • 批准号:
    61780017
  • 财政年份:
    1986
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
A study on the conkersion from a sentence speech to a kanji-kana string using phoneme recognition, syntax and semantics processings
使用音素识别、语法和语义处理从句子语音到汉字假名串的转换研究
  • 批准号:
    59420031
  • 财政年份:
    1984
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (A)
不特定話者による連続音素認識に関する研究
非特定说话人连续音素识别研究
  • 批准号:
    57460207
  • 财政年份:
    1982
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了