遺伝的アルゴリズムを用いる音声認識モデルの構成法に関する研究
利用遗传算法构建语音识别模型的研究
基本信息
- 批准号:06680363
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for General Scientific Research (C)
- 财政年份:1994
- 资助国家:日本
- 起止时间:1994 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
情報処理システムと人間との間で情報の授受を行うとき、音声言語を媒介とすることは、人間にとって最も根源的かつ高速で便利な手段である。本研究では、情報処理システムが音声言語を受理する機能である音声の自動認識について、その高性能化を目的として、遺伝的アルゴリズムを用いて認識モデルを構成する新しい手法を提案し、その有効性を実証する。具体的には、生物の個体に対応して種々のマルコフモデルを多数生成する。遺伝子コードとしては、マルコフモデルの状態数と状態遷移関係を採用し、モデルの適応度として、訓練用データに対するモデルの認識率を採用する。この方法では世代を経るに従い、認識率の低いモデルは淘汰され、より認識率の高いモデルが生き残るので、高性能音声認識モデルが得られる。本年度の研究は、以下のように行った。音声データの作成では、CD-ROMで供給されているNIST「TIDIGITS」から英語の数字および4桁数字単語を取り出し、大容量ハードディスクに格納した。プログラムの作成では、(1)状態数および状態遷移関係が可変のプログラムとした。(2)遺伝子コーディング部は、予備的にすでに作ってあるプログラムを参照して新たに作成した。認識実験での実験項目は、(1)多数状態マルコフモデルの性能評価、(2)遺伝子コーディング法の性能評価である。以上の実験により、その有効性が示された。
Information processing is the most convenient way to send and receive information between people. This study aims to propose new methods for information processing system, voice recognition system, voice recognition system, voice recognition The individual of a specific organism is responsible for the production of a large number of species. The number of states and the state transition relationship between the number of states and the number of states used for training are used. This method is based on the generation, low recognition rate, high recognition rate, high performance sound recognition rate. This year's research is conducted in the following ways: Audio and video production, CD-ROM supply, NIST "TIDIGITS" from English to 4, digital language extraction, high-capacity audio and video production (1) The number of states and the state transition relationship can be changed. (2)The first part of the article is about the preparation of a new article. To understand the implementation of the project,(1) the majority of the state of the performance evaluation,(2) the transmission of the sub-state of the performance evaluation The above is true and effective.
项目成果
期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
高良富夫: "多数状態マルコフモデルを用いる連続単語音声認識の検討" 計測自動制御学会合同シンポジウム. 427-434 (1994)
Tomio Takara:“使用多状态马尔可夫模型进行连续词语音识别的研究”仪器与控制工程师协会联合研讨会427-434(1994)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
高良富夫: "単語音声認識における隠れマルコフモデルの構造の実験的検討" 計測自動制御学会合同シンポジウム. 421-426 (1994)
Tomio Takara:“单词语音识别中隐马尔可夫模型结构的实验研究”仪器与控制工程师学会联合研讨会421-426(1994)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
高良富夫: "多数状態マルコフモデルの再学習法を用いる連続単語音声認識" 日本音響学会秋季研究発表会講演論文集. I. 13-14 (1994)
Tomio Takara:“使用多状态马尔可夫模型再学习方法的连续词语音识别”日本声学学会秋季研究会议论文集 I. 13-14 (1994)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
高良 富夫其他文献
高良 富夫的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('高良 富夫', 18)}}的其他基金
日本共通語と琉球方言との間の音韻対応分析エキスパートシステム
日语通用语与琉球方言语音对应分析专家系统
- 批准号:
01780050 - 财政年份:1989
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
マルコフ・モデルを用いるDPマッチングによる音声自動認識
使用马尔可夫模型通过 DP 匹配进行自动语音识别
- 批准号:
63780046 - 财政年份:1988
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
琉球方言音声の合成による高精度分析
琉球方言语音合成高精度分析
- 批准号:
62780045 - 财政年份:1987
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
琉球方言音声の分析および合成
琉球方言语音分析与综合
- 批准号:
60780050 - 财政年份:1985
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
脳神経疾患による構音障害を克服するための,音声認識および音声合成AIシステムの開発
开发语音识别与语音合成AI系统,克服脑神经疾病引起的构音障碍
- 批准号:
24K10630 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (C)
画像認識と音声認識の複合AIによる災害状況認識ユニットの基礎研究
图像识别与语音识别相结合的AI灾情识别单元基础研究
- 批准号:
23K23017 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (B)
非母語話者のスマートフォン音声認識機能での誤認識傾向を考慮した発音学習システム
使用智能手机语音识别功能,考虑到非母语人士的误识别倾向的发音学习系统。
- 批准号:
24K06231 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (C)
画像・音声認識と料理データベースによる食事記録システム開発、及び疫学研究での応用
基于图像/语音识别和烹饪数据库的用餐记录系统的开发及其在流行病学研究中的应用
- 批准号:
23K20170 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (B)
自動音声認識を利用したbilingual speech-to-textシステム構築と授業分析への応用
自动语音识别双语语音转文本系统的构建及其在课程分析中的应用
- 批准号:
24K04125 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (C)
CAREER: Statistically-Sound Knowledge Discovery from Data
职业:从数据中发现统计上合理的知识
- 批准号:
2238693 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Continuing Grant
実用性の高いEnd-to-End音声認識に向けた研究
高实用性端到端语音识别研究
- 批准号:
22KJ2898 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Grant-in-Aid for JSPS Fellows
音声認識のデータ拡張のための音声合成との密統合
与语音合成紧密集成,用于语音识别的数据增强
- 批准号:
23K16944 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Early-Career Scientists
画像認識と音声認識の複合AIによる災害状況認識ユニットの基礎研究
图像识别与语音识别相结合的AI灾情识别单元基础研究
- 批准号:
22H01749 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (B)
日常生活音を活用した構音障害者のための音響監視および音声認識システムの研究
使用日常声音对构音障碍患者进行声学监测和语音识别系统的研究
- 批准号:
22K12168 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (C)