話し言葉音声の高度化に関する研究
口语复杂性研究
基本信息
- 批准号:07J10096
- 负责人:
- 金额:$ 1.15万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2007
- 资助国家:日本
- 起止时间:2007 至 2008
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
近年の音声認識技術では,新聞記事やニュース原稿などの「書き言葉」を読み上げた音声に対しては95%以上の認識性能が得られるのに対し,我々の日常生活において通常用いられる「話し言葉」の音声では,その認識精度は極端に低下する.音声認識技術には,音声の自動書き起こしの他にもデジタルメディアの音声検索,自動インデキシング,キーワード抽出による自動要約などのように極めて多様な応用が考えられる.そのため,話し言葉の音声認識技術を向上させることは現実社会の利便性を高めるために必要不可欠である.報告者の先行研究として,話し言葉音声特有の特徴として知られている「発声の怠け」に注目し,複数の大規模コーパスを用いて,この特徴に関する統計的かつ定量的な分析を行い,話し言葉音声の認識性能低下に与える影響を明らかにした.この特徴により,読み上げ音声に対して話し言葉音声では全体的に音素ケプストラム空間の縮小が生じており,認識性能の低下を引き起こしていることが明らかになっている.今年度では,話し言葉音声における「発声の怠け」に対し,より局所的な視点から分析を行い,さらにこの特徴によって生じた認識性能低下への対策法を提案した.具体的には,話し言葉音声において認識誤りが生じた各単語に対して,認識誤り原因の同定法を用いることにより認識誤り単語を「音響的誤り単語」「言語的誤り単語」「検索誤り単語」に分類し,それぞれの出現頻度を比較した.その結果,「音響的誤り単語」の出現頻度が高くなっていることが明らかになった.「音響的誤り単語」とは,音声の音響的特徴量が変化することによりモデルとの不整合が生じた単語であり,当該単語においては局所的な「発声の怠け」が頻繁に生じていると考えられる.「音響的誤り単語」と正解単語に関して,各単語を構成する音素のケプストラム空間の大きさを比較したところ,正解単語に対して音響的誤り単語におけるケプストラム空間は小さくなっている傾向が見られた.この結果は,話し言葉音声において局所的な「発声の怠け」が頻繁に生じていることを定量的に示している.この現象に対する対策法として,「音響的誤り単語」に相当するケプストラム特徴量を拡大する「ケプストラム空間拡張法」を提案した.この手法を適用することにより,単語正解精度が絶対値で1.25%向上することを明らかにした.
In recent years, more than 95% of the cognitive performance of the sound recognition technology in news records, manuscripts and "book and speech leaves" has been achieved, and the cognitive accuracy of the sound recognition technology in our daily life has been extremely low. Sound recognition technology, sound and sound automatic book start and other information, sound and sound search, automatic search, search, extraction, automatic offer, search, search, search. It is necessary to improve the efficiency of society. The reporter's advance research focuses on the characteristics of speech sound, the use of multiple large-scale voice, the statistical and quantitative analysis of these characteristics, and the impact of low cognitive performance of speech sound. The characteristics of this feature are: the sound of the upper part of the voice is opposite to the sound of the lower part of the voice, and the sound of the lower part of the voice is opposite to the sound of the lower part of the voice. This year, we propose a strategy to solve the problem of low cognitive performance by analyzing the viewpoint of the bureau and its characteristics. In particular, in the case of words and sounds, cognitive errors occur in each language, and the causes of cognitive errors are determined in the same way. In the case of cognitive errors,"acoustic errors","speech errors","search errors" are classified and their frequency of occurrence is compared. As a result, the frequency of occurrence of "sound error" is high. "Sound error words" and "sound characteristics" are changed, and when the words are changed,"sound errors" are frequently generated. "Sound error words" and correct solution words are related to each other, each word is composed of phonemes, the space of phonemes is large, the correct solution words are related to sound error words, the space of phonemes is small, the tendency of phonemes is small. As a result, this quantitative indication shows that the "sound loss" caused by the sound of words and leaves becomes frequent. This phenomenon is related to the strategy method,"sound error language" is equivalent to the "sound space expansion method" proposed. This method is applicable to all kinds of problems. The accuracy of positive solution is 1.25% higher than that of negative solution.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
「KLDを用いた中国語における読み上げ音声と話レ言葉音声の違いの分析」
《利用KLD分析汉语朗读语音和口语语音的差异》
- DOI:
- 发表时间:2007
- 期刊:
- 影响因子:0
- 作者:中村 匡伸;劉 鵬;宋 認平;古井 貞煕
- 通讯作者:古井 貞煕
The effect of spectral space reduction in spontaneous speech on recognition performances
自发语音谱空间缩减对识别性能的影响
- DOI:
- 发表时间:2007
- 期刊:
- 影响因子:0
- 作者:Masanobu Nakamura;Koji Iwano;Sadaoki Furui
- 通讯作者:Sadaoki Furui
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
中村 匡伸其他文献
イスラームの知と実践のあいだ-ヒジャーブ着用に関するザイナブ・アル=ガザーリーの語
伊斯兰知识与实践之间——扎伊纳布·安萨里关于戴头巾的言论
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
中村 匡伸;劉 鵬;宋 認平;古井 貞煕;後藤絵美 - 通讯作者:
後藤絵美
中村 匡伸的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
- 批准号:
2908918 - 财政年份:2027
- 资助金额:
$ 1.15万 - 项目类别:
Studentship
Thermal engineering in semiconductor heterojunction for space transducers
空间换能器半导体异质结的热工程
- 批准号:
DP240102230 - 财政年份:2024
- 资助金额:
$ 1.15万 - 项目类别:
Discovery Projects
Tracking flood waters over Australia using space gravity data
使用空间重力数据跟踪澳大利亚的洪水
- 批准号:
DP240102399 - 财政年份:2024
- 资助金额:
$ 1.15万 - 项目类别:
Discovery Projects
Navigating Chemical Space with Natural Language Processing and Deep Learning
利用自然语言处理和深度学习驾驭化学空间
- 批准号:
EP/Y004167/1 - 财政年份:2024
- 资助金额:
$ 1.15万 - 项目类别:
Research Grant
NSF Engines Development Award: Utilizing space research, development and manufacturing to improve the human condition (OH)
NSF 发动机发展奖:利用太空研究、开发和制造来改善人类状况(OH)
- 批准号:
2314750 - 财政年份:2024
- 资助金额:
$ 1.15万 - 项目类别:
Cooperative Agreement
CAREER: From Underground to Space: An AI Infrastructure for Multiscale 3D Crop Modeling and Assessment
职业:从地下到太空:用于多尺度 3D 作物建模和评估的 AI 基础设施
- 批准号:
2340882 - 财政年份:2024
- 资助金额:
$ 1.15万 - 项目类别:
Continuing Grant
Postdoctoral Fellowship: EAR-PF: Taxon-Specific Cross-Scale Responses to Aridity Gradients through Time and across Space in the NW Great Basin of the United States
博士后奖学金:EAR-PF:美国西北部大盆地随时间和空间的干旱梯度的分类单元特异性跨尺度响应
- 批准号:
2305325 - 财政年份:2024
- 资助金额:
$ 1.15万 - 项目类别:
Fellowship Award
Co-evolution of supermassive black holes and galaxies with the James Webb Space Telescope
超大质量黑洞和星系与詹姆斯·韦伯太空望远镜的共同演化
- 批准号:
23K22533 - 财政年份:2024
- 资助金额:
$ 1.15万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
CAREER:HCC: Using Virtual Reality Gaming to Develop a Predictive Simulation of Human-Building Interactions: Behavioral and Emotional Modeling for Public Space Design
职业:HCC:使用虚拟现实游戏开发人类建筑交互的预测模拟:公共空间设计的行为和情感建模
- 批准号:
2339999 - 财政年份:2024
- 资助金额:
$ 1.15万 - 项目类别:
Continuing Grant
EAGER: Fertilizing the Tree of Life with novel taxa from deep-sea vent microbial metagenomes collected over time and space
EAGER:用随时间和空间收集的深海喷口微生物宏基因组中的新类群为生命之树施肥
- 批准号:
2409507 - 财政年份:2024
- 资助金额:
$ 1.15万 - 项目类别:
Standard Grant