Development of high-accuracy system for recognizing spontaneous speech
高精度自发语音识别系统的开发
基本信息
- 批准号:22500144
- 负责人:
- 金额:$ 2.5万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2010
- 资助国家:日本
- 起止时间:2010 至 2012
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
In our research, we aimed to improve the system performance for recognizing spontaneousspeech, which was considered to be more difficult than recognizing read speech. We focused on three technical issues: (1) acoustic and language models, (2) system combinationtechniques, and (3) speaker indexing. For improving the performance of acoustic models,we investigated a discrete-mixture hidden Markov model based on discriminative training, speaker-class model, quinphone, and a reverberation-class model. Some systemco(a) mbinationtechniquesw(a) ere investigated, such as the combination of continuous anddiscrete models, the combination of various quinphones, and the combination of reverberation-class models. For the issues of language models, we proposed the cross adaptation and cross-validation adaptation techniques. In addition, we improved theperformance of speaker indexing techniques based on speaker vectors required during theexecution of speaker adaptation.
在我们的研究中,我们的目标是提高系统的性能,识别自发语音,这被认为是比识别阅读语音更困难。我们集中讨论了三个技术问题:(1)声学和语言模型,(2)系统组合技术,(3)说话人索引。为了提高声学模型的性能,我们研究了一种基于区分训练的离散混合隐马尔可夫模型,说话人类模型,五音子模型和混响类模型。研究了连续模型与离散模型相结合、多种五音子相结合、混响级模型相结合等系统组合技术。针对语言模型的问题,提出了交叉自适应和交叉验证自适应技术。此外,我们还改进了基于说话人自适应过程中所需的说话人向量的说话人索引技术的性能。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
識別学習を用いた離散混合分布HMMによる音声認識
使用离散混合分布 HMM 进行判别学习的语音识别
- DOI:
- 发表时间:2013
- 期刊:
- 影响因子:0
- 作者:Miyazaki;K.;小坂哲夫,加藤正治
- 通讯作者:小坂哲夫,加藤正治
入力音声の韻律情報を用いたHMM音声合成
使用输入语音的韵律信息进行 HMM 语音合成
- DOI:
- 发表时间:2013
- 期刊:
- 影响因子:0
- 作者:Tomoko Nariai;Kazuyo Tanaka;Tatsuya Kawahara;栗原大樹,加藤正治,小坂哲夫
- 通讯作者:栗原大樹,加藤正治,小坂哲夫
Performance Improvement in Automatic Evaluation System of English Pronunciation by Using Various Normalization Methods
多种归一化方法提高英语发音自动评价系统的性能
- DOI:
- 发表时间:2010
- 期刊:
- 影响因子:0
- 作者:Masaru Kusumi;Masaharu Kato;Tetsuo Kosaka and Itaru Matsunaga
- 通讯作者:Tetsuo Kosaka and Itaru Matsunaga
Speaker Adaptation Based on System Combination Using Speaker-Class Models
基于使用扬声器类模型的系统组合的扬声器自适应
- DOI:
- 发表时间:2010
- 期刊:
- 影响因子:0
- 作者:Tetsuo Kosaka;Takashi Ito;Masaharu Kato and Masaki Kohda
- 通讯作者:Masaharu Kato and Masaki Kohda
Lecture Speech Recognition by Combining Word Graphs of Various Acoustic Models
结合各种声学模型的词图进行讲座语音识别
- DOI:
- 发表时间:2010
- 期刊:
- 影响因子:0
- 作者:Tetsuo Kosaka;Keisuke Goto;Takashi Ito and Masaharu Kato
- 通讯作者:Takashi Ito and Masaharu Kato
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
KOSAKA Tetsuo其他文献
KOSAKA Tetsuo的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('KOSAKA Tetsuo', 18)}}的其他基金
Development of Noise Robust Speech Recognition and Its Application on Mobile Environment
噪声鲁棒语音识别的发展及其在移动环境下的应用
- 批准号:
16500097 - 财政年份:2004
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
相似海外基金
初期ドイツモード雑誌テクストの言語的特徴とはー話し言葉性とテクストタイプの研究
早期德国时尚杂志文本的语言特征是什么?口语和文本类型的研究。
- 批准号:
24K16056 - 财政年份:2024
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
日本人中国語学習者の書き言葉と話し言葉における言語特徴の分析
日本汉语学习者书面语和口语的语言特征分析
- 批准号:
23K18866 - 财政年份:2023
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for Research Activity Start-up
脳科学・認知科学による人間に近いモデルに基づく日本語話し言葉解析器の構築と検証
基于脑科学和认知科学的类人模型日语口语分析仪的构建与验证
- 批准号:
21K18115 - 财政年份:2021
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for Challenging Research (Pioneering)
自然なヒューマンコンピュータインタラクションのための話し言葉会話音声合成
自然人机交互的口语对话语音合成
- 批准号:
13J08776 - 财政年份:2013
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for JSPS Fellows
工学系話し言葉コーパスの構築及びそれに基づく教材開発支援
工程口语语料库建设及支撑教材开发
- 批准号:
21652050 - 财政年份:2009
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
日本語話し言葉における「係り先の不在」現象に関する実証的研究
日语口语“参照点缺失”现象的实证研究
- 批准号:
09J03227 - 财政年份:2009
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for JSPS Fellows
「非母語話者による日本語話し言葉コーパス」における印象評定と音声的特徴
“非母语日语口语语料库”中的印象评分和语音特征
- 批准号:
18720138 - 财政年份:2006
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
話し言葉音声の効率的なアーカイブ処理と対話的な検索
口语音频的高效归档和交互式检索
- 批准号:
05J02201 - 财政年份:2005
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for JSPS Fellows
話し言葉音声認識のための発話速度変動に頑健な音響モデルの開発
开发对语速波动具有鲁棒性的声学模型,用于口语语音识别
- 批准号:
16700171 - 财政年份:2004
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for Young Scientists (B)