文節境界を考慮した統計的言語モデルの高度化と音声認識への利用
推进考虑子句边界及其在语音识别中的使用的统计语言模型
基本信息
- 批准号:16650034
- 负责人:
- 金额:$ 2.11万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Exploratory Research
- 财政年份:2004
- 资助国家:日本
- 起止时间:2004 至 2005
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
日本語の言語構造・発話構造を考慮した新しい統計的言語モデルを開発した上で、それを音声認識システムに組み込む有効な方策を開発することを目的として以下の成果を達成した。1.文節境界をまたぐ場合とまたがない場合のtri-gramモデルを学習し、従来のtri-gramモデルと比較し、8%程度以上のperplexityの減少が可能なことを示した。さらに、連続音声認識用openソフトウエアJuliusの第2パスに作成したtri-gramモデルを実装し、JNAS音声コーパスの音声サンプルについて認識実験を行った。新聞記事1年分で学習した言語モデルを用いた場合、提案した言語モデルを用いることにより、従来と比較して8%程度の認識率の改善が得られた。新聞記事3年分で学習した言語モデルを用いた場合には、顕著な改善効果は得られなかった。この観点から、提案したモデルは特に十分な学習コーパスが得られないときに有効であることが推察される。2.上記は朗読音声に対する成果である。これを自発発話音声に発展させるため、自発発話で多く見られるFillerが深い文節境界で生起する確率が高いことに着目し、Fillerを検出するための韻律モジュールを開発した。当該形態素の韻律的特徴等を入力パラメータとする4層パーセプトロンで韻律モジュールを構築し、74%程度のフィラー検出率を達成した。この韻律モジュールをJuliusに組み込むことにより、90%を超えるRecall率を達成した。今後は、これをもとにFillerを考慮した言語モデルを作成し、自由発話音声の認識に用いる手法の開発を進める。3.観測される基本周波数パターンと生成過程モデルにより生成される基本周波数パターンとの差分を、文の言語情報、音素情報、指令パラメータから推定する手法を開発し、観測される基本周波数パターンとの誤差を5%程度低減できることを示した。
实现了以下结果,目的是开发一种新的统计语言模型,该模型考虑日语的语言和语音结构,并制定有效的措施将其纳入语音识别系统。 1。我们学到了一个三克模型,其中跨越子句边界并没有穿越,并表明与常规的三克模型相比,可以将困惑减少约8%或更高。此外,我们实施了在朱利叶斯(Julius)的第二次通过,即连续语音识别的开放软件中创建的三克模型,并在JNAS语音语料库的音频样本上进行了识别实验。当使用经过一年报纸文章的培训的语言模型时,与以前的版本相比,建议的语言模型用于提高识别率约8%。当使用三年的报纸文章中学习的语言模型时,未能获得显着的改进效果。从这个角度来看,可以推断提出的模型在没有足够的学习语料库时特别有效。 2。以上是阅读音频的结果。为了将其发展为自发的演讲,我们开发了一个用于检测填充剂的韵律模块,重点是在自发语音中经常出现的填充物在深度条款边界上发生的很高的可能性。使用四层感知器构建一个韵律模块,其词素特征作为输入参数,并实现了约74%的填充检测率。通过将这个韵律模块纳入朱利叶斯,我们达到了90%以上的召回率。将来,我们将使用它来创建一种语言模型,该模型考虑了填充物,并开发了将其用于识别语音语音的方法。 3。我们开发了一种方法来估计观察到的基本频率模式与从语言信息,音素信息和句子的命令参数产生的基本频率模式与基本频率模式之间的差异,并表明观察到的基本频率模式之间的误差可以降低约5%。
项目成果
期刊论文数量(18)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Filled pauses as cues to the complexity of following phrases
填充停顿作为后续短语复杂性的提示
- DOI:
- 发表时间:2005
- 期刊:
- 影响因子:0
- 作者:篠原正典;廣川佐千男;野本 忠司;野本 忠司;Takayuki Kitasaka;宮本秀昭;鳥脇純一郎;鳥脇純一郎;林雄一郎;Takayuki Kitasaka;鳥脇純一郎;宮本秀昭;佐藤嘉晃;高木隆司;J.Toriwaki;鳥脇純一郎;鳥脇純一郎;広瀬啓吉;広瀬啓吉;Keikichi Hirose;阿部悠;阿部悠;河村美由紀;Michiko Watanabe
- 通讯作者:Michiko Watanabe
Detection of fillers using prosodic features in spontaneous speech recognition of Japanese
在日语自发语音识别中使用韵律特征检测填充物
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:篠原正典;廣川佐千男;野本 忠司;野本 忠司;Takayuki Kitasaka;宮本秀昭;鳥脇純一郎;鳥脇純一郎;林雄一郎;Takayuki Kitasaka;鳥脇純一郎;宮本秀昭;佐藤嘉晃;高木隆司;J.Toriwaki;鳥脇純一郎;鳥脇純一郎;広瀬啓吉;広瀬啓吉;Keikichi Hirose
- 通讯作者:Keikichi Hirose
韻律を用いた連続音声認識
使用韵律进行连续语音识别
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:篠原正典;廣川佐千男;野本 忠司;野本 忠司;Takayuki Kitasaka;宮本秀昭;鳥脇純一郎;鳥脇純一郎;林雄一郎;Takayuki Kitasaka;鳥脇純一郎;宮本秀昭;佐藤嘉晃;高木隆司;J.Toriwaki;鳥脇純一郎;鳥脇純一郎;広瀬啓吉
- 通讯作者:広瀬啓吉
音声認識時の韻律利用によるフィラー検出
在语音识别过程中使用韵律进行填充检测
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:篠原正典;廣川佐千男;野本 忠司;野本 忠司;Takayuki Kitasaka;宮本秀昭;鳥脇純一郎;鳥脇純一郎;林雄一郎;Takayuki Kitasaka;鳥脇純一郎;宮本秀昭;佐藤嘉晃;高木隆司;J.Toriwaki;鳥脇純一郎;鳥脇純一郎;広瀬啓吉;広瀬啓吉;Keikichi Hirose;阿部悠;阿部悠
- 通讯作者:阿部悠
F_0モデルパラメータの自動抽出における統計的手法の利用
利用统计方法自动提取F_0模型参数
- DOI:
- 发表时间:2005
- 期刊:
- 影响因子:0
- 作者:篠原正典;廣川佐千男;野本 忠司;野本 忠司;Takayuki Kitasaka;宮本秀昭;鳥脇純一郎;鳥脇純一郎;林雄一郎;Takayuki Kitasaka;鳥脇純一郎;宮本秀昭;佐藤嘉晃;高木隆司;J.Toriwaki;鳥脇純一郎;鳥脇純一郎;広瀬啓吉;広瀬啓吉;Keikichi Hirose;阿部悠;阿部悠;河村美由紀;Michiko Watanabe;Keikichi Hirose;渡辺美知子;渡辺美知子;阿部悠;古山悠介
- 通讯作者:古山悠介
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
広瀬 啓吉其他文献
生成過程モデルに基づく母語話者と中国語話者の日本語朗読音声の基本周波数パターン
基于生成过程模型的母语者和汉语者日语阅读语音的基本频率模式
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
平野 宏子;広瀬 啓吉;河合 剛;顧文 涛;峯松 信明 - 通讯作者:
峯松 信明
音調核モデルに基づく中国語F_0パターンの2段階生成
基于声调核模型的汉语F_0模式的两步生成
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史;河村 美由紀;孫慶華 - 通讯作者:
孫慶華
種々の調子の音声合成のための韻律制御-感情音声合成の視点から-(招待講演)
各种声调语音合成的韵律控制——从情感语音合成的角度——(特邀报告)
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉 - 通讯作者:
広瀬 啓吉
Corpus-based extraction of F_0 contour generation process model parameters
基于语料库提取F_0轮廓生成过程模型参数
- DOI:
- 发表时间:
2005 - 期刊:
- 影响因子:0
- 作者:
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史;河村 美由紀;孫慶華;Keikichi Hirose;Keikichi Hirose - 通讯作者:
Keikichi Hirose
文節単位での感情の程度を考慮した統計的韻律制御
考虑每个短语的情感程度的统计韵律控制
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史 - 通讯作者:
浅野 泰史
広瀬 啓吉的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('広瀬 啓吉', 18)}}的其他基金
認知モデルと常識ベースに基づく情動を含む音声コミュニケーション
语音通信,包括基于认知模型和常识的情感
- 批准号:
08F08049 - 财政年份:2008
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for JSPS Fellows
劣条件下の混合音響信号の分離とその音声認識への利用
恶劣条件下混合声信号的分离及其在语音识别中的应用
- 批准号:
06F06099 - 财政年份:2006
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for JSPS Fellows
フィンランド人日本語学習者による日本語語い音調の韻律研究
芬兰日语学习者对日语声调的韵律研究
- 批准号:
06F05756 - 财政年份:2005
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for JSPS Fellows
フィンランド人日本語学習者による日本語語い音調の韻律研究
芬兰日语学习者对日语声调的韵律研究
- 批准号:
05F05756 - 财政年份:2005
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for JSPS Fellows
中国語基本周波数パターンの分析、定式化と合成手法の開発
中国基频模式分析、合成方法的制定和发展
- 批准号:
04F04035 - 财政年份:2004
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for JSPS Fellows
高品質音声合成のための韻律制御
高质量语音合成的韵律控制
- 批准号:
12132202 - 财政年份:2000
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
韻律に着目した音声言語情報処理の高度化
以韵律为中心的口语信息处理的复杂性
- 批准号:
12132101 - 财政年份:2000
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
モーラ遷移確率モデルによる韻律の表現と音声認識への利用に関する研究
基于mora转移概率模型的韵律表达及其在语音识别中的应用研究
- 批准号:
11878058 - 财政年份:1999
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Exploratory Research
韻律に着目した音声言語情報処理の高度化に関する調査研究
以韵律为中心的口语信息处理进展研究
- 批准号:
10898014 - 财政年份:1998
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
モデルの広がりを考慮した頑健な音声認識手法の研究
考虑模型扩散的鲁棒语音识别方法研究
- 批准号:
09878065 - 财政年份:1997
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Exploratory Research
相似海外基金
大規模児童作文コーパスにおける埋め込み節の発達の計量的分析
大规模儿童作文语料库中嵌入子句发展的定量分析。
- 批准号:
19K23068 - 财政年份:2019
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Research Activity Start-up
Language Processing Technologies for Understanding and Production of Text
用于理解和生成文本的语言处理技术
- 批准号:
15H02748 - 财政年份:2015
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
the study of Japanese literature and cultural history through analyzing the concept of tohi that the capital is more prestigious than other areas
通过分析首都比其他地区更有声望的东肥概念来研究日本文学和文化史
- 批准号:
25580052 - 财政年份:2013
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
An Engineering Approach to Plain Japanese
通俗日语的工程方法
- 批准号:
24300052 - 财政年份:2012
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
A Research on Coherence and Interference in Clause Structures
从句结构的连贯与干扰研究
- 批准号:
19320071 - 财政年份:2007
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (B)