文節境界を考慮した統計的言語モデルの高度化と音声認識への利用
推进考虑子句边界及其在语音识别中的使用的统计语言模型
基本信息
- 批准号:16650034
- 负责人:
- 金额:$ 2.11万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Exploratory Research
- 财政年份:2004
- 资助国家:日本
- 起止时间:2004 至 2005
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
日本語の言語構造・発話構造を考慮した新しい統計的言語モデルを開発した上で、それを音声認識システムに組み込む有効な方策を開発することを目的として以下の成果を達成した。1.文節境界をまたぐ場合とまたがない場合のtri-gramモデルを学習し、従来のtri-gramモデルと比較し、8%程度以上のperplexityの減少が可能なことを示した。さらに、連続音声認識用openソフトウエアJuliusの第2パスに作成したtri-gramモデルを実装し、JNAS音声コーパスの音声サンプルについて認識実験を行った。新聞記事1年分で学習した言語モデルを用いた場合、提案した言語モデルを用いることにより、従来と比較して8%程度の認識率の改善が得られた。新聞記事3年分で学習した言語モデルを用いた場合には、顕著な改善効果は得られなかった。この観点から、提案したモデルは特に十分な学習コーパスが得られないときに有効であることが推察される。2.上記は朗読音声に対する成果である。これを自発発話音声に発展させるため、自発発話で多く見られるFillerが深い文節境界で生起する確率が高いことに着目し、Fillerを検出するための韻律モジュールを開発した。当該形態素の韻律的特徴等を入力パラメータとする4層パーセプトロンで韻律モジュールを構築し、74%程度のフィラー検出率を達成した。この韻律モジュールをJuliusに組み込むことにより、90%を超えるRecall率を達成した。今後は、これをもとにFillerを考慮した言語モデルを作成し、自由発話音声の認識に用いる手法の開発を進める。3.観測される基本周波数パターンと生成過程モデルにより生成される基本周波数パターンとの差分を、文の言語情報、音素情報、指令パラメータから推定する手法を開発し、観測される基本周波数パターンとの誤差を5%程度低減できることを示した。
In Japan, there are some strategies and policies for the opening of the program, the purpose of the program, and the following results. 1. In the context of the situation, it is possible to learn more from tri-gram, tri-gram from less than 8 per cent of the perplexity. The sound of the connection is known as the open sound, the sound of the Julius, the sound of the tri-gram, the sound of the JNAS, the sound of the sound, the sound. The new chronicle records one year's worth of academic records, and the rate of improvement is better than the rate of 8% improvement. The new chronicle is divided into three years. I have learned how to use it and improve it. It is very important to make a point and propose a proposal to make a survey. two。 In the last part of the story, I heard the sound of the sound. The sound of self-talk, the sound of self- When there are some factors such as the characteristics of the law, and so on, the input force is 4%, and the rate of recovery is 74%. We need to know that the rate of Julius is very high, and the Recall rate is 90% higher than normal. In the future, in the future, we will be able to learn more about Filler in the future. In the future, we will be able to learn more about speech and voice learning. 3. The basic number of waves is generated. The number of basic waves is generated. The number of basic waves is generated. The difference, language, phoneme, and instructions are displayed. The method of presumption is open, and the number of basic waves is 5% lower than that of 5%.
项目成果
期刊论文数量(18)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Detection of fillers using prosodic features in spontaneous speech recognition of Japanese
在日语自发语音识别中使用韵律特征检测填充物
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:篠原正典;廣川佐千男;野本 忠司;野本 忠司;Takayuki Kitasaka;宮本秀昭;鳥脇純一郎;鳥脇純一郎;林雄一郎;Takayuki Kitasaka;鳥脇純一郎;宮本秀昭;佐藤嘉晃;高木隆司;J.Toriwaki;鳥脇純一郎;鳥脇純一郎;広瀬啓吉;広瀬啓吉;Keikichi Hirose
- 通讯作者:Keikichi Hirose
Filled pauses as cues to the complexity of following phrases
填充停顿作为后续短语复杂性的提示
- DOI:
- 发表时间:2005
- 期刊:
- 影响因子:0
- 作者:篠原正典;廣川佐千男;野本 忠司;野本 忠司;Takayuki Kitasaka;宮本秀昭;鳥脇純一郎;鳥脇純一郎;林雄一郎;Takayuki Kitasaka;鳥脇純一郎;宮本秀昭;佐藤嘉晃;高木隆司;J.Toriwaki;鳥脇純一郎;鳥脇純一郎;広瀬啓吉;広瀬啓吉;Keikichi Hirose;阿部悠;阿部悠;河村美由紀;Michiko Watanabe
- 通讯作者:Michiko Watanabe
韻律を用いた連続音声認識
使用韵律进行连续语音识别
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:篠原正典;廣川佐千男;野本 忠司;野本 忠司;Takayuki Kitasaka;宮本秀昭;鳥脇純一郎;鳥脇純一郎;林雄一郎;Takayuki Kitasaka;鳥脇純一郎;宮本秀昭;佐藤嘉晃;高木隆司;J.Toriwaki;鳥脇純一郎;鳥脇純一郎;広瀬啓吉
- 通讯作者:広瀬啓吉
音声認識時の韻律利用によるフィラー検出
在语音识别过程中使用韵律进行填充检测
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:篠原正典;廣川佐千男;野本 忠司;野本 忠司;Takayuki Kitasaka;宮本秀昭;鳥脇純一郎;鳥脇純一郎;林雄一郎;Takayuki Kitasaka;鳥脇純一郎;宮本秀昭;佐藤嘉晃;高木隆司;J.Toriwaki;鳥脇純一郎;鳥脇純一郎;広瀬啓吉;広瀬啓吉;Keikichi Hirose;阿部悠;阿部悠
- 通讯作者:阿部悠
F_0モデルパラメータの自動抽出における統計的手法の利用
利用统计方法自动提取F_0模型参数
- DOI:
- 发表时间:2005
- 期刊:
- 影响因子:0
- 作者:篠原正典;廣川佐千男;野本 忠司;野本 忠司;Takayuki Kitasaka;宮本秀昭;鳥脇純一郎;鳥脇純一郎;林雄一郎;Takayuki Kitasaka;鳥脇純一郎;宮本秀昭;佐藤嘉晃;高木隆司;J.Toriwaki;鳥脇純一郎;鳥脇純一郎;広瀬啓吉;広瀬啓吉;Keikichi Hirose;阿部悠;阿部悠;河村美由紀;Michiko Watanabe;Keikichi Hirose;渡辺美知子;渡辺美知子;阿部悠;古山悠介
- 通讯作者:古山悠介
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
広瀬 啓吉其他文献
生成過程モデルに基づく母語話者と中国語話者の日本語朗読音声の基本周波数パターン
基于生成过程模型的母语者和汉语者日语阅读语音的基本频率模式
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
平野 宏子;広瀬 啓吉;河合 剛;顧文 涛;峯松 信明 - 通讯作者:
峯松 信明
音調核モデルに基づく中国語F_0パターンの2段階生成
基于声调核模型的汉语F_0模式的两步生成
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史;河村 美由紀;孫慶華 - 通讯作者:
孫慶華
種々の調子の音声合成のための韻律制御-感情音声合成の視点から-(招待講演)
各种声调语音合成的韵律控制——从情感语音合成的角度——(特邀报告)
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉 - 通讯作者:
広瀬 啓吉
文節単位での感情の程度を考慮した統計的韻律制御
考虑每个短语的情感程度的统计韵律控制
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史 - 通讯作者:
浅野 泰史
広瀬 啓吉的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('広瀬 啓吉', 18)}}的其他基金
認知モデルと常識ベースに基づく情動を含む音声コミュニケーション
语音通信,包括基于认知模型和常识的情感
- 批准号:
08F08049 - 财政年份:2008
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for JSPS Fellows
劣条件下の混合音響信号の分離とその音声認識への利用
恶劣条件下混合声信号的分离及其在语音识别中的应用
- 批准号:
06F06099 - 财政年份:2006
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for JSPS Fellows
フィンランド人日本語学習者による日本語語い音調の韻律研究
芬兰日语学习者对日语声调的韵律研究
- 批准号:
06F05756 - 财政年份:2005
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for JSPS Fellows
フィンランド人日本語学習者による日本語語い音調の韻律研究
芬兰日语学习者对日语声调的韵律研究
- 批准号:
05F05756 - 财政年份:2005
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for JSPS Fellows
中国語基本周波数パターンの分析、定式化と合成手法の開発
中国基频模式分析、合成方法的制定和发展
- 批准号:
04F04035 - 财政年份:2004
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for JSPS Fellows
高品質音声合成のための韻律制御
高质量语音合成的韵律控制
- 批准号:
12132202 - 财政年份:2000
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
韻律に着目した音声言語情報処理の高度化
以韵律为中心的口语信息处理的复杂性
- 批准号:
12132101 - 财政年份:2000
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
モーラ遷移確率モデルによる韻律の表現と音声認識への利用に関する研究
基于mora转移概率模型的韵律表达及其在语音识别中的应用研究
- 批准号:
11878058 - 财政年份:1999
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Exploratory Research
韻律に着目した音声言語情報処理の高度化に関する調査研究
以韵律为中心的口语信息处理进展研究
- 批准号:
10898014 - 财政年份:1998
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
モデルの広がりを考慮した頑健な音声認識手法の研究
考虑模型扩散的鲁棒语音识别方法研究
- 批准号:
09878065 - 财政年份:1997
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Exploratory Research