話し言葉音声認識のための発話速度変動に頑健な音響モデルの開発
开发对语速波动具有鲁棒性的声学模型,用于口语语音识别
基本信息
- 批准号:16700171
- 负责人:
- 金额:$ 2.18万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Young Scientists (B)
- 财政年份:2004
- 资助国家:日本
- 起止时间:2004 至 2005
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究は、話し言葉音声における発話速度変動に頑健な音声認識を目指し、話速変化による認識率低下の抑制について、大きく分けて1.話速によるデータクラスタリングでの話速別モデルの構築。各話速別モデルを融合したモデル(HMM/BNモデル、マルチパスモデル)による各話速に対する評価。2.分析周期を変更したデータによる局所話速に対応したモデルの構築。分析周期を変更した複数モデルの認識結果統合による認識率改善手法。の2つの手法により検討を行なった。データクラスタリング話速別モデルによる検討では以下のような結果を得た。a.話速別モデルを用いることで話速に対応した認識精度が得られる。HMMパラメータの話速モデル化の調査では、話速別モデルのHMMパラメータのうち、特にガウス分布が話速変化をモデル化していることが分かった。b.種々の話速別モデルの融合モデルの認識精度は各話速別モデルを単独で用いる場合の精度を上回っており、融合モデルによる効果は観られたが、ほぼ全話速に対して単純なHMMより劣る結果であった。話速別にデータを分割してしまうことによる学習データ量減少の問題が大きいと考えられる。分析周期変更モデルによる検討では以下のよう塗結果を得た。a.分析周期を従来の半分としたモデルで、従来の分析周期のモデルと比べて、話速の速い場合において認識精度が改善できた。一方で、分析周期を短くすることにより、話速が遅い場合に挿入誤りを増加させる結果となり、話速の遅い場合においては精度が低下した。b.分析周期が異なるモデルの認識結果を単語信頼度を利用したROVER法により統合することで単独システムの結果に比べトータルでの認識精度を改善することができた。
In this study, the speed of speech, the sound of speech, the sound of speech, the speed of speech, the sound of speech, the sound of speech, the speed of speech, the speed of speech, the sound of speech, the sound of speech, the speed of speech, the speed of speech, the sound of speech, the sound of speech, the speed of speech, the As soon as possible, please make sure that you don't know what to do. Each speed is different to integrate the information system (HMM/BN system, information system) on each speed of the system. two。 During the analysis period, the speed of the analysis is much higher than that of the bureau. In the analysis cycle, the complexity of the analysis was compared. The results showed that the rate of improvement was improved. I don't know. I don't know what to do. Please make sure that the results below are satisfactory. a. In order to improve the accuracy of your knowledge, you can improve the accuracy of your knowledge. HMM, you need to make sure that you want to make sure that you don't have any information, that is, you need to make sure that you have a better understanding of the situation, and that you have a better understanding of the distribution system. b. A variety of speed measurement systems can be used to improve the accuracy of the information system, and the accuracy of each system will be used independently. The accuracy of the last test, the integration of the results, and the full speed of the HMM test results will be verified. As soon as possible, we need to learn more about the problem of low volume and low volume. During the analysis cycle, the results of the following analysis results are satisfactory. a. The analysis cycle is divided into two parts: the analysis cycle, the analysis cycle, the speed, the speed, the accuracy, the accuracy, the accuracy. On the one hand, the analysis period is very short, and the accuracy is low. b. The results of the analysis cycle are much better than those of the ROVER method. The results show that the accuracy is improved.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
山本 一公其他文献
超高齢者音声コーパスEARSの構築と音声認識へ利用の予備的検討
高龄语音语料库EARS的构建及其用于语音识别的初步研究
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
福田 芽衣子;入部 百合絵;西崎 博光;山本 一公;西村 良太;北岡 教英 - 通讯作者:
北岡 教英
残響下音声認識評価基盤(CENSREC-4)の構築
混响语音识别评估平台(CENSREC-4)的构建
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
西浦 敬信;中山 雅人;傳田 遊亀;北岡 教英;山本 一公;山田 武志;藤本 雅清;柘植 覚;宮島 千代美;滝口 哲也;田村 哲嗣;小川 哲司;松田 繁樹;黒岩 眞吾;武田 一哉;中村 哲 - 通讯作者:
中村 哲
山本 一公的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('山本 一公', 18)}}的其他基金
Development of end-to-end speech recognition techniques for super-elderly that can deal with the cause of recognition errors
开发针对高龄老人的端到端语音识别技术,可处理识别错误的原因
- 批准号:
22K12084 - 财政年份:2022
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
音声認識のための動的特徴を効果的に用いる隠れマルコフモデルに関する研究
有效利用动态特征进行语音识别的隐马尔可夫模型研究
- 批准号:
13780274 - 财政年份:2001
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
相似海外基金
"Mimicking Human Head Sound Responses": Towards an Anatomically Accurate Head Prototype for Bone Conduction Crosstalk Cancellation Analysis with Humans
“模仿人类头部声音反应”:构建解剖学上准确的头部原型,用于人类骨传导串扰消除分析
- 批准号:
24K20786 - 财政年份:2024
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
SBIR Phase II: A Manufacturing Monitoring System Using Sound Spectrograms and Artificial Intelligence
SBIR 第二阶段:使用声谱图和人工智能的制造监控系统
- 批准号:
2335395 - 财政年份:2024
- 资助金额:
$ 2.18万 - 项目类别:
Cooperative Agreement
Capturing Oceanic Submesoscales, Stirring and Mixing with Sound and Simulations
通过声音和模拟捕捉海洋亚尺度、搅拌和混合
- 批准号:
EP/Y014693/1 - 财政年份:2024
- 资助金额:
$ 2.18万 - 项目类别:
Research Grant
Capturing Oceanic Submesoscales, Stirring, and Mixing with Sound and Simulations
通过声音和模拟捕捉海洋亚尺度、搅拌和混合
- 批准号:
MR/X035611/1 - 财政年份:2024
- 资助金额:
$ 2.18万 - 项目类别:
Fellowship
Sonorous Landscapes: Using sound and creative design methods to capture and communicate biodiversity in an urban forest
响亮的景观:使用声音和创造性的设计方法来捕捉和传达城市森林中的生物多样性
- 批准号:
AH/Z50547X/1 - 财政年份:2024
- 资助金额:
$ 2.18万 - 项目类别:
Research Grant
Development of data-driven multiple sound spot synthesis technology based on deep generative neural network models
基于深度生成神经网络模型的数据驱动多声点合成技术开发
- 批准号:
23K11177 - 财政年份:2023
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Measurement of physiological load in online learning and verification of the effect of creating a background sound environment
在线学习生理负荷测量及背景音环境营造效果验证
- 批准号:
23K11370 - 财政年份:2023
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
The Role of Speech Perception and Production in Sound Change: A Case Study of Kagoshima Japanese
言语感知和产生在声音变化中的作用:鹿儿岛日本人的案例研究
- 批准号:
22KJ3070 - 财政年份:2023
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for JSPS Fellows
Connections between sound composition and visual art through the transformation of sound material into 3D objects and sonic spaces
通过将声音材料转换为 3D 对象和声音空间,声音创作与视觉艺术之间的联系
- 批准号:
2893455 - 财政年份:2023
- 资助金额:
$ 2.18万 - 项目类别:
Studentship














{{item.name}}会员




