文節境界を考慮した統計的言語モデルの高度化と音声認識への利用

推进考虑子句边界及其在语音识别中的使用的统计语言模型

基本信息

批准号：
16650034
负责人：
広瀬啓吉
金额：
$ 2.11万
依托单位：
The University of Tokyo
依托单位国家：
日本
项目类别：
Grant-in-Aid for Exploratory Research
财政年份：
2004
资助国家：
日本
起止时间：
2004 至 2005
项目状态：
已结题

项目摘要

日本語の言語構造・発話構造を考慮した新しい統計的言語モデルを開発した上で、それを音声認識システムに組み込む有効な方策を開発することを目的として以下の成果を達成した。1.文節境界をまたぐ場合とまたがない場合のtri-gramモデルを学習し、従来のtri-gramモデルと比較し、8%程度以上のperplexityの減少が可能なことを示した。さらに、連続音声認識用openソフトウエアJuliusの第2パスに作成したtri-gramモデルを実装し、JNAS音声コーパスの音声サンプルについて認識実験を行った。新聞記事1年分で学習した言語モデルを用いた場合、提案した言語モデルを用いることにより、従来と比較して8%程度の認識率の改善が得られた。新聞記事3年分で学習した言語モデルを用いた場合には、顕著な改善効果は得られなかった。この観点から、提案したモデルは特に十分な学習コーパスが得られないときに有効であることが推察される。2.上記は朗読音声に対する成果である。これを自発発話音声に発展させるため、自発発話で多く見られるFillerが深い文節境界で生起する確率が高いことに着目し、Fillerを検出するための韻律モジュールを開発した。当該形態素の韻律的特徴等を入力パラメータとする4層パーセプトロンで韻律モジュールを構築し、74%程度のフィラー検出率を達成した。この韻律モジュールをJuliusに組み込むことにより、90%を超えるRecall率を達成した。今後は、これをもとにFillerを考慮した言語モデルを作成し、自由発話音声の認識に用いる手法の開発を進める。3.観測される基本周波数パターンと生成過程モデルにより生成される基本周波数パターンとの差分を、文の言語情報、音素情報、指令パラメータから推定する手法を開発し、観測される基本周波数パターンとの誤差を5%程度低減できることを示した。

实现了以下结果，目的是开发一种新的统计语言模型，该模型考虑日语的语言和语音结构，并制定有效的措施将其纳入语音识别系统。 1。我们学到了一个三克模型，其中跨越子句边界并没有穿越，并表明与常规的三克模型相比，可以将困惑减少约8％或更高。此外，我们实施了在朱利叶斯（Julius）的第二次通过，即连续语音识别的开放软件中创建的三克模型，并在JNAS语音语料库的音频样本上进行了识别实验。当使用经过一年报纸文章的培训的语言模型时，与以前的版本相比，建议的语言模型用于提高识别率约8％。当使用三年的报纸文章中学习的语言模型时，未能获得显着的改进效果。从这个角度来看，可以推断提出的模型在没有足够的学习语料库时特别有效。 2。以上是阅读音频的结果。为了将其发展为自发的演讲，我们开发了一个用于检测填充剂的韵律模块，重点是在自发语音中经常出现的填充物在深度条款边界上发生的很高的可能性。使用四层感知器构建一个韵律模块，其词素特征作为输入参数，并实现了约74％的填充检测率。通过将这个韵律模块纳入朱利叶斯，我们达到了90％以上的召回率。将来，我们将使用它来创建一种语言模型，该模型考虑了填充物，并开发了将其用于识别语音语音的方法。 3。我们开发了一种方法来估计观察到的基本频率模式与从语言信息，音素信息和句子的命令参数产生的基本频率模式与基本频率模式之间的差异，并表明观察到的基本频率模式之间的误差可以降低约5％。

项目成果

期刊论文数量（18）

专著数量（0）

科研奖励数量（0）

会议论文数量（0）

专利数量（0）

Filled pauses as cues to the complexity of following phrases

填充停顿作为后续短语复杂性的提示

DOI：
发表时间：
2005
期刊：
Proc.9^<th> European Conference on Speech Communication and Technology (INTERSPEECH) CD-ROM
影响因子：
0
作者：
篠原正典;廣川佐千男;野本忠司;野本忠司;Takayuki Kitasaka;宮本秀昭;鳥脇純一郎;鳥脇純一郎;林雄一郎;Takayuki Kitasaka;鳥脇純一郎;宮本秀昭;佐藤嘉晃;高木隆司;J.Toriwaki;鳥脇純一郎;鳥脇純一郎;広瀬啓吉;広瀬啓吉;Keikichi Hirose;阿部悠;阿部悠;河村美由紀;Michiko Watanabe
通讯作者：
Michiko Watanabe

Detection of fillers using prosodic features in spontaneous speech recognition of Japanese

在日语自发语音识别中使用韵律特征检测填充物

DOI：
发表时间：
2006
期刊：
Proc.International Conference on Speech Prosody (発表予定)
影响因子：
0
作者：
篠原正典;廣川佐千男;野本忠司;野本忠司;Takayuki Kitasaka;宮本秀昭;鳥脇純一郎;鳥脇純一郎;林雄一郎;Takayuki Kitasaka;鳥脇純一郎;宮本秀昭;佐藤嘉晃;高木隆司;J.Toriwaki;鳥脇純一郎;鳥脇純一郎;広瀬啓吉;広瀬啓吉;Keikichi Hirose
通讯作者：
Keikichi Hirose

韻律を用いた連続音声認識

使用韵律进行连续语音识别

DOI：
发表时间：
2006
期刊：
韻律と音声言語情報処理-アクセント・イントネーション・リズムの科学-(丸善) 5章2節
影响因子：
0
作者：
篠原正典;廣川佐千男;野本忠司;野本忠司;Takayuki Kitasaka;宮本秀昭;鳥脇純一郎;鳥脇純一郎;林雄一郎;Takayuki Kitasaka;鳥脇純一郎;宮本秀昭;佐藤嘉晃;高木隆司;J.Toriwaki;鳥脇純一郎;鳥脇純一郎;広瀬啓吉
通讯作者：
広瀬啓吉

音声認識時の韻律利用によるフィラー検出

在语音识别过程中使用韵律进行填充检测

DOI：
发表时间：
2006
期刊：
日本音響学会講演論文集 CD-ROM
影响因子：
0
作者：
篠原正典;廣川佐千男;野本忠司;野本忠司;Takayuki Kitasaka;宮本秀昭;鳥脇純一郎;鳥脇純一郎;林雄一郎;Takayuki Kitasaka;鳥脇純一郎;宮本秀昭;佐藤嘉晃;高木隆司;J.Toriwaki;鳥脇純一郎;鳥脇純一郎;広瀬啓吉;広瀬啓吉;Keikichi Hirose;阿部悠;阿部悠
通讯作者：
阿部悠

F_0モデルパラメータの自動抽出における統計的手法の利用

利用统计方法自动提取F_0模型参数

DOI：
发表时间：
2005
期刊：
日本音響学会講演論文集 1
影响因子：
0
作者：
篠原正典;廣川佐千男;野本忠司;野本忠司;Takayuki Kitasaka;宮本秀昭;鳥脇純一郎;鳥脇純一郎;林雄一郎;Takayuki Kitasaka;鳥脇純一郎;宮本秀昭;佐藤嘉晃;高木隆司;J.Toriwaki;鳥脇純一郎;鳥脇純一郎;広瀬啓吉;広瀬啓吉;Keikichi Hirose;阿部悠;阿部悠;河村美由紀;Michiko Watanabe;Keikichi Hirose;渡辺美知子;渡辺美知子;阿部悠;古山悠介
通讯作者：
古山悠介

DOI：
{{ item.doi }}
发表时间：
{{ item.publish_year }}
期刊：
{{ item.journal_name }}
影响因子：
{{ item.factor }}
作者：
{{ item.authors }}
通讯作者：
{{ item.author }}

数据更新时间：{{ journalArticles.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ monograph.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ sciAawards.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ conferencePapers.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ patent.updateTime }}

広瀬啓吉其他文献

生成過程モデルに基づく母語話者と中国語話者の日本語朗読音声の基本周波数パターン

基于生成过程模型的母语者和汉语者日语阅读语音的基本频率模式

DOI：
发表时间：
2007
期刊：
影响因子：
0
作者：
平野宏子;広瀬啓吉;河合剛;顧文涛;峯松信明
通讯作者：
峯松信明

音調核モデルに基づく中国語F_0パターンの2段階生成

基于声调核模型的汉语F_0模式的两步生成

DOI：
发表时间：
2006
期刊：
電子情報通信学会技術研究報告(音声研究会) SP2005-159
影响因子：
0
作者：
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬啓吉;浅野泰史;河村美由紀;孫慶華
通讯作者：
孫慶華

種々の調子の音声合成のための韻律制御-感情音声合成の視点から-(招待講演)

各种声调语音合成的韵律控制——从情感语音合成的角度——（特邀报告）

DOI：
发表时间：
2006
期刊：
日本音響学会講演論文集 CD-ROM
影响因子：
0
作者：
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬啓吉
通讯作者：
広瀬啓吉

Corpus-based extraction of F_0 contour generation process model parameters

基于语料库提取F_0轮廓生成过程模型参数

DOI：
发表时间：
2005
期刊：
Proceedings Inerspeech 2005 1
影响因子：
0
作者：
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬啓吉;浅野泰史;河村美由紀;孫慶華;Keikichi Hirose;Keikichi Hirose
通讯作者：
Keikichi Hirose

文節単位での感情の程度を考慮した統計的韻律制御

考虑每个短语的情感程度的统计韵律控制

DOI：
发表时间：
2006
期刊：
日本音響学会講演論文集 CD-ROM
影响因子：
0
作者：
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬啓吉;浅野泰史
通讯作者：
浅野泰史