音声認識手法の高度化に関する研究

语音识别方法的进展研究

基本信息

  • 批准号:
    01608001
  • 负责人:
  • 金额:
    $ 9.92万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
  • 财政年份:
    1987
  • 资助国家:
    日本
  • 起止时间:
    1987 至 1989
  • 项目状态:
    已结题

项目摘要

本研究の目標は、1.文章を朗読した音声を認識対象とした連続音声認識システム(日本語Dictationシステム)の作成2.音声学的見地からの既存の音声認識の枠組みの見直し3.既存の音声認識手法の見直しの3つである。以下に研究成果を述べる。1.日本語Dictationシステムこのシステムは話者適応部、音響処理部、音素認識部、統語処理部からなる。話者適応部では、教師無し高速話者適応化法を開発した。この方法では、入力音声の内容は未知でよく、かつ4秒程度の音声があれば十分機能する。音素認識部では、修正LVQ2法と最適音素系列選択法による高精度音素認識法を開発した。不特定話者単語音声(男性3名、女性2名)に対して、音素認識率86.5%、脱落率1.7%、付加率9.0%、多数話者連続音声(男性2名、文節単位)に対して、音素認識率86.1%、脱落率3.9%、付加率7.7%を得た。統語処理部では、一般的な日本語を対象とした言語情報処理システムを開発した。具体的には、文節オートマトンに基づく構文駆動型連続DP法と構文意味情報を利用した統語処理法である。音素認識率85%を仮定したシミュレーション実験の結果、文認識率62.5%、文節認識率79.8%を得た。最後に、日本語Dictationシステムのプロトタイプを作成した。このシステムの語彙(異なり語数)は、実質語(名詞、動詞、形容詞など)853語、付属語(助詞、助動詞など)281語である。多数話者連続音声へ適用したところ、文認識率32.6%、文節認識率73.2%を得た。2.音声学的見地からの既存の音声認識の枠組みの見直しでは、東北地方における方言音と標準音の関係を明らかにした。さらに自動音声認識の立場からの音素の再定義も試みた。3.既存の音声認識手法の見直しでは、DPビームサーチによる認識アルゴリズムの計算量低減のための効率の良い技刈法を提案するとともに、確率に基づいたネットワーク素子を用いた音素認識法を開発した。
The purpose of this study is as follows: 1. To establish the Japanese Dictation System for sound recognition; 2. To understand the existing sound recognition methods; 3. To understand the existing sound recognition methods. The following research results are described. 1. Japanese Dictation System: Speech Adaptation Department, Sound Processing Department, Phoneme Recognition Department, Language Processing Department The speaker is suitable for the department, the teacher is free from high speed, the speaker is suitable for the method of transformation, and the teacher is free from high speed. This method is not known, the content of the input sound is unknown, and the sound is very functional at the level of 4 seconds. The phoneme recognition part develops the modified LVQ2 method and the optimal phoneme series selection method. The phoneme recognition rate, drop-out rate, and addition rate were 86.5%, 1.7%, 9.0% and 86.1%, 3.9%, and 7.7% respectively. The system language processing section is open to general Japanese language processing. Specific text, text. The phoneme recognition rate was 85%, the text recognition rate was 62.5%, and the text recognition rate was 79.8%. Finally, Japanese Dictation is made. 853 words, subordinate words (auxiliary words, auxiliary verbs)281 words, Most of the speakers were able to understand the pronunciation of the speech, the recognition rate of the text was 32.6%, and the recognition rate of the text section was 73.2%. 2. Sound acoustics is the knowledge of existing sound and sound, and the relationship between dialect sound and standard language in Northeast China is clear. This time, automatic sound recognition and position redefinition of phonemes are attempted. 3. The existing sound recognition method is developed by using the sound recognition method, which reduces the calculation amount and improves the efficiency.

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
松本,山下: "ベクトル量子化誤差の区分平均化による教師なし話者適応" 電子情報通信学会論文誌A. J72ーA. 869-872 (1989)
Matsumoto, Yamashita:“通过矢量量化误差分段平均进行无监督说话人自适应”IEICE Transactions A. J72-A (1989)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Hiroshi Matsumoto: "Text independent speaker identification from short utterances based on piecewise discriminant analysis" Computer Speech and Language. 3. 133-150 (1989)
Hiroshi Matsumoto:“基于分段判别分析的短话语中与文本无关的说话人识别”计算机语音和语言。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
三輪,長宝: "3音素組コンテキストの音素混同確率行列を用いた単語音声認識" 電子情報通信学会論文誌DーII. J72ーDーII. 1234-1241 (1989)
Miwa, Nagataka:“在三音素组上下文中使用音素混淆概率矩阵进行单词语音识别”,电子、信息和通信工程师学会杂志 D-II J72-D-II (1989)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
古賀,牧野,城戸: "ローカルピークによる語中母音の認識率改善の一方法" 日本音響学会誌. 45. 290-292 (1989)
Koga,Makino,Kido:“使用局部峰值提高单词中元音识别率的方法”日本声学学会杂志 45. 290-292 (1989)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

城戸 健一其他文献

城戸 健一的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('城戸 健一', 18)}}的其他基金

音声認識手法の高度化に関する研究
语音识别方法的进展研究
  • 批准号:
    63608001
  • 财政年份:
    1988
  • 资助金额:
    $ 9.92万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
音声認識手法の高度化に関する研究
语音识别方法的进展研究
  • 批准号:
    62608001
  • 财政年份:
    1987
  • 资助金额:
    $ 9.92万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
人間における音声情報の処理機構の解明と応用に関する総合的研究
人类语音信息处理机制阐明与应用的综合研究
  • 批准号:
    56380005
  • 财政年份:
    1981
  • 资助金额:
    $ 9.92万
  • 项目类别:
    Grant-in-Aid for Co-operative Research (A)
音声言語情報の人間における生成・知覚・認識及び理解の過程に関する総合的研究
人类口语和语言信息的生成、感知、识别和理解过程的综合研究
  • 批准号:
    X00050----438005
  • 财政年份:
    1979
  • 资助金额:
    $ 9.92万
  • 项目类别:
    Grant-in-Aid for Co-operative Research (A)
単語音声の自動認識に関する研究
词音自动识别研究
  • 批准号:
    X00090----955089
  • 财政年份:
    1974
  • 资助金额:
    $ 9.92万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
単語音声の自動認識に関する研究
词音自动识别研究
  • 批准号:
    X00090----855097
  • 财政年份:
    1973
  • 资助金额:
    $ 9.92万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
音声情報の自動処理に関する基礎的研究
语音信息自动处理基础研究
  • 批准号:
    X00040-----92415
  • 财政年份:
    1972
  • 资助金额:
    $ 9.92万
  • 项目类别:
    Grant-in-Aid for Special Project Research
音響計測における多元情報処理に関する研究
声学测量中多维信息处理研究
  • 批准号:
    X00080----746065
  • 财政年份:
    1972
  • 资助金额:
    $ 9.92万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (B)
音声情報の自動処理に関する基礎的研究
语音信息自动处理基础研究
  • 批准号:
    X46040-----90921
  • 财政年份:
    1971
  • 资助金额:
    $ 9.92万
  • 项目类别:
    Grant-in-Aid for Special Project Research
自動制御を利用した電力用変圧器の騒音制御に関する研究
自动控制电力变压器噪声控制研究
  • 批准号:
    X45120----450037
  • 财政年份:
    1970
  • 资助金额:
    $ 9.92万
  • 项目类别:
    Grant-in-Aid for Developmental Scientific Research

相似海外基金

ナラティブはどのようにして生じるのか?-自然言語処理技術を用いた検討-
叙事是如何出现的?
  • 批准号:
    24K16786
  • 财政年份:
    2024
  • 资助金额:
    $ 9.92万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
方言音声データの分析と検索を可能にする諸方言に普遍な音声言語処理基盤モデルの構築
构建多种方言的通用语音语言处理平台模型,实现方言语音数据的分析和检索
  • 批准号:
    24K00450
  • 财政年份:
    2024
  • 资助金额:
    $ 9.92万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
言語流暢性課題の定性的分析方法の構築:語彙特性と自然言語処理の応用
构建语言流畅性任务的定性分析方法:词汇特征和自然语言处理的应用
  • 批准号:
    24K10484
  • 财政年份:
    2024
  • 资助金额:
    $ 9.92万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
自然言語処理に最適な語彙と分割の仕方を自動で獲得する人工知能の創出
创建自动获取自然语言处理最佳词汇和切分方法的人工智能
  • 批准号:
    24K20852
  • 财政年份:
    2024
  • 资助金额:
    $ 9.92万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
日本語母語英語学習者の第二言語処理運用能力の発達:習得から習熟へ
日本英语母语学习者第二语言处理技能的发展:从习得到掌握
  • 批准号:
    24K00084
  • 财政年份:
    2024
  • 资助金额:
    $ 9.92万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
能動学習を用いた、放射線科所見文重要度推定用自然言語処理システムの開発
开发自然语言处理系统,使用主动学习来评估放射学结果的重要性
  • 批准号:
    24K18797
  • 财政年份:
    2024
  • 资助金额:
    $ 9.92万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
中学英語はいかに定着するか:言語処理技術を援用した学習システム開発と脳科学的検証
初中英语如何建立:利用语言处理技术和神经科学验证的学习系统的开发
  • 批准号:
    23K20478
  • 财政年份:
    2024
  • 资助金额:
    $ 9.92万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
自然言語処理技術を用いた食物アレルゲン性予測システム構築
利用自然语言处理技术构建食物过敏性预测系统
  • 批准号:
    24K01707
  • 财政年份:
    2024
  • 资助金额:
    $ 9.92万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
言語処理における多感覚モダリティーの相互作用
语言处理中多感官模式的相互作用
  • 批准号:
    24KJ0438
  • 财政年份:
    2024
  • 资助金额:
    $ 9.92万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
自然言語処理を用いた重粒子線治療の適応判定のための自動チャットシステムの開発
开发自动聊天系统,利用自然语言处理确定重离子放射治疗的适用性
  • 批准号:
    24K18821
  • 财政年份:
    2024
  • 资助金额:
    $ 9.92万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了