単語認識における遺伝アルゴリズムの応用

遗传算法在文字识别中的应用

基本信息

  • 批准号:
    05750423
  • 负责人:
  • 金额:
    $ 0.58万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1993
  • 资助国家:
    日本
  • 起止时间:
    1993 至 无数据
  • 项目状态:
    已结题

项目摘要

本研究では,連続発生された音声を自動的に音韻が変化する部分を検出してさらにそれぞれのセグメントの音の認識を行なうための方法について考察した.音声は16kHzでサンプリングし,それを10次の自己回帰モデルで表現し,それをもとにナイキスト周波数までを等間隔に分ける周波数を10個選択し,その周波数でのスペクトルを特徴ベクトルとした.音声の変化点は従来行なわれているように固定の大きさの窓を設けてその中で同定を行ない,窓をずらして特徴ベクトルの変化点を検出するのではなく,遺伝的アルゴリズムにより音素の切れ目を設定し,それにより区分化されたデータよりLevinson-Durbin法により自己回帰モデルを計算した.優れた切れ目であればそこで生成したモデルとデータの適合度が高くなり,切れ目が悪ければ1つのモデルで表現することが困難であることから適合度が悪く,誤差が大きくなるという原理である.この誤差の2乗和を元にしてそれの逆数を適合度と定義し,遺伝的アルゴリズムを繰り返す.遺伝的アルゴリズムは個体数を10個とし,各個体は切れ目の数ほど整数からなる要素を持つ.通常遺伝的アルゴリズムでは2進数が用いられるが,ここでは個体の長さを短くするためにこのようなコードを用いた.繰り返しは20回行なった.実験では,まず母音各10個ずつを使って3層の階層型ニューラルネットで学習し,認識モデルを作成した.これは他のデータを使っても90%以上の正解率を得る優れたモデルであった.次に,/おはよう/と,母音以外の音韻を含む音をこのアルゴリズムにしたがって7個の区間に分け,それぞれの特徴ベクトルを認識させたところ,耳で聞いて音の変化点と思われる点でほぼ分割された.また,/は,/よ/の部分ではモデルにない子音が含まれているためあいまいな認識結果を得た.
In this study, in connection with the automatic sound processing section of the audio sound system, we can find out the information about the method of voice recognition and the method of sound recognition. There are 10 options for the number of 16kHz waves, the number of waves. The sound is changed from the point of view of the sound, and the sound is changed. In the setting of the device, the same line is set in the setting of the sound, the sound is changed, the sound is fixed, the same is set in the settings of the settings, and the Levinson-Durbin method is used to check the calculation of the computer. In this paper, the results show that the accuracy is high, and that the difference between the two is different. In terms of the difference between the two figures and the inverse number of the data, the definition of the difference is defined, and the data of the data is returned. The number of individual units is less than 10 yuan, and the number of cut eyes of each body is equal to that of the whole number of elements. In general, the number of people in the system is very high, while the number of people in the system is very short. If you want to go back, you will go back 20 times. There are 10 vowels and 10 vowels each to make the 3-year-old model learn to learn, and the knowledge-based model to become a model. Please tell me that the correct solution rate is higher than 90%. The second sound, other than the vowel, contains the sound, the sound, the sound, In some cases, the consonant contains the consonant and the result is good.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

田中 雅博其他文献

Kinectを用いた運動姿勢の評価支援システム
使用 Kinect 的运动姿势评估支持系统
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    須谷 章宣;田中 雅博
  • 通讯作者:
    田中 雅博
模範体操をもちいた体操採点システムの基盤構築 -システムのフレームワーク-
使用模型体操为体操评分系统奠定基础 - 系统框架 -
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    須谷 章宣;田中 雅博;田中 雅博
  • 通讯作者:
    田中 雅博

田中 雅博的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('田中 雅博', 18)}}的其他基金

離散時間システムの事象検出と同定における遺伝的アルゴリズムの応用
遗传算法在离散时间系统事件检测与识别中的应用
  • 批准号:
    04750418
  • 财政年份:
    1992
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

脳神経疾患による構音障害を克服するための,音声認識および音声合成AIシステムの開発
开发语音识别与语音合成AI系统,克服脑神经疾病引起的构音障碍
  • 批准号:
    24K10630
  • 财政年份:
    2024
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
画像認識と音声認識の複合AIによる災害状況認識ユニットの基礎研究
图像识别与语音识别相结合的AI灾情识别单元基础研究
  • 批准号:
    23K23017
  • 财政年份:
    2024
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
画像・音声認識と料理データベースによる食事記録システム開発、及び疫学研究での応用
基于图像/语音识别和烹饪数据库的用餐记录系统的开发及其在流行病学研究中的应用
  • 批准号:
    23K20170
  • 财政年份:
    2024
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
非母語話者のスマートフォン音声認識機能での誤認識傾向を考慮した発音学習システム
使用智能手机语音识别功能,考虑到非母语人士的误识别倾向的发音学习系统。
  • 批准号:
    24K06231
  • 财政年份:
    2024
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
自動音声認識を利用したbilingual speech-to-textシステム構築と授業分析への応用
自动语音识别双语语音转文本系统的构建及其在课程分析中的应用
  • 批准号:
    24K04125
  • 财政年份:
    2024
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
実用性の高いEnd-to-End音声認識に向けた研究
高实用性端到端语音识别研究
  • 批准号:
    22KJ2898
  • 财政年份:
    2023
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
音声認識のデータ拡張のための音声合成との密統合
与语音合成紧密集成,用于语音识别的数据增强
  • 批准号:
    23K16944
  • 财政年份:
    2023
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
画像認識と音声認識の複合AIによる災害状況認識ユニットの基礎研究
图像识别与语音识别相结合的AI灾情识别单元基础研究
  • 批准号:
    22H01749
  • 财政年份:
    2022
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
日常生活音を活用した構音障害者のための音響監視および音声認識システムの研究
使用日常声音对构音障碍患者进行声学监测和语音识别系统的研究
  • 批准号:
    22K12168
  • 财政年份:
    2022
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
自動音声認識と機械学習による新たな医学教育システムの創出
使用自动语音识别和机器学习创建新的医学教育系统
  • 批准号:
    22K10459
  • 财政年份:
    2022
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了