トップダウン処理とボトムアップ処理を併用した大語量単語音声認識に関する研究

采用自上而下和自下而上处理的大词语音识别研究

基本信息

  • 批准号:
    04680022
  • 负责人:
  • 金额:
    $ 1.02万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
  • 财政年份:
    1992
  • 资助国家:
    日本
  • 起止时间:
    1992 至 无数据
  • 项目状态:
    已结题

项目摘要

本研究により得られた知見を、要約すると以下のようになる。1.大語彙単語音声データベースの作成: 音素ラベルを音素表記と音声表記のどちらでもアクセスできるデータベースの重要性を示した。2.シンプルな機構を持つ音素認識法の開発: 異なる時間の音素カテゴリの相互情報を利用するため、階層型音素認識ネットワーク素子による音素認識方式を提案した。特定話者認識実験より、94.1%の高い音素認識率となり、従来型と比較して/N/等の音素の認識率が改善され、異なる性質の事後確率系列が得られることを示した。3.ボトムアップ処理による単語音声認識法の開発:3音素組コンテキストの音素混同行列を用いた方式を提案し、音素系列のマッチングによる方法であるため、認識性能が高く、高速処理が可能であり、単語の予備選択に有効であることを示した。4.トップダウン処理による単語音声認識法の開発: 単語の仮説と事後確率系列による単語の検定により認識精度を高める方式は、入力音声の特徴に依存した検定が可能なため、認識性能向上に有効であることを示した。5.大語彙単語音声認識実験: 5240単語の大語彙単語音声認識実験を行い、特定話者で84.4%の単語認識率を得ることができた。この実験から、性質の異なる事後確率系列を相加平均して用いることが有効であり、認識率と処理時間の観点から大語彙の単語音声認識には、トップダウン処理とボトムアップ処理を併用した本方式が有効であることを示した。6.研究成果の公表: 本研究の成果を、日本音響学会の講演会および電子情報通信学会の音声研究会で口頭発表した。
This study was conducted in the following ways: 1. The importance of phoneme table notation and phoneme table notation is shown. 2. The development of phoneme recognition method based on hierarchical phoneme recognition: the development of phoneme recognition method based on hierarchical phoneme recognition. 94.1% of high phoneme recognition rate for specific speakers, 94% of high phoneme recognition rate for specific speakers 3. The development of single phonological recognition method:3. The method of phoneme group mixing, phoneme series mixing, recognition performance, high speed processing, single phonological selection, etc. 4. The development of sound recognition method: single language, single language. 5. Speech recognition rate for large words: 5240 for single words, 84.4% for specific words This method is used in combination with the following methods: 6. The results of this study were presented orally at the lecture of the Japan Sound Society and the Sound Research Conference of the Electronic Information Communication Society.

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
今 誠紀: "音素事後確率の時間パターンを特徴とした音素認識" 電子情報通信学会 技術報告(音声). SP92-124. 1-8 (1993)
Masanori Kon:“以音素后验概率的时间模式为特征的音素识别”IEICE 技术报告(音频)1-8(1993 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
今 誠紀: "階層型音素認識ネットワーク素子を用いた単語音声認識" 日本音響学会 春季講演論文集. 2Q23. 129-130 (1993)
Makoto Kon:“使用分层音素识别网络元素进行单词语音识别”日本声学学会春季会议记录 129-130(1993 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
今 誠紀: "階層型ネットワーク素子を用いた音素認識" 日本音響学会 秋季講演論文集. 3-1-1. 141-142 (1992)
Makoto Kon:“使用分层网络元素进行音素识别”日本声学学会秋季会议记录 3-1-142(1992 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

三輪 譲二其他文献

発音自動評価機能を有するWeb統合型日本語教育システム
具有自动发音评估功能的网络集成日语教育系统

三輪 譲二的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('三輪 譲二', 18)}}的其他基金

日本語方言音声の階層型高精度スペクトル推定法に関する研究
日语方言语音分层高精度谱估计方法研究
  • 批准号:
    63780018
  • 财政年份:
    1988
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
調音結合正規化のための特徴の時間重み付けと時間変化形状による音素認識の研究
利用特征时间加权和时变形状进行发音组合归一化的音素识别研究
  • 批准号:
    61780017
  • 财政年份:
    1986
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
階層的大分類と最適局所重み付けを用いた類似単語音声の認職に関する研究
基于层次分类和最优局部权重的相似词音识别研究
  • 批准号:
    60780017
  • 财政年份:
    1985
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
予備選択と非線形スペクトル整合を利用した不特定話者多数単語音声の認識に関する研究
基于初步选择和非线性谱匹配的非特定人多词语音识别研究
  • 批准号:
    58780020
  • 财政年份:
    1983
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
多数単語音声の自動認識の方法に関する研究
多词语音自动识别方法研究
  • 批准号:
    56790014
  • 财政年份:
    1981
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
不特定話者単語音声自動認識のための特徴パラメータに関する研究
非特定人语音自动识别特征参数研究
  • 批准号:
    X00210----579010
  • 财政年份:
    1980
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

ASDにおける感覚異常の脳基盤をボトムアップ・トップダウン処理の両側面から検討
从自下而上和自上而下处理方面检查自闭症谱系障碍感觉异常的大脑基础
  • 批准号:
    20K07953
  • 财政年份:
    2020
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
トップダウン処理の感情生成とその制御に関する神経生理学的検討-基礎から応用へ―
通过自上而下的处理进行情绪产生及其控制的神经生理学研究 - 从基础到应用 -
  • 批准号:
    20K14251
  • 财政年份:
    2020
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
知覚学習におけるトップダウン処理の役割について
论自上而下的加工在知觉学习中的作用
  • 批准号:
    03J06613
  • 财政年份:
    2003
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
視覚的アウェアネスにおけるボトムアップ処理とトップダウン処理
视觉意识中的自下而上和自上而下的处理
  • 批准号:
    01J08082
  • 财政年份:
    2001
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
並行トップダウン処理方式を用いた多様な入力画像を許容する顔画像解析法の研究
采用并行自上而下处理方法接受各种输入图像的面部图像分析方法研究
  • 批准号:
    02650255
  • 财政年份:
    1990
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了