权益分类	功能权益	普通用户	{{item.name}}会员
{{category.name}}	{{benefitItem.name}}

高品質音声合成のための韻律制御

高质量语音合成的韵律控制

基本信息

批准号：
12132202
负责人：
広瀬啓吉
金额：
$ 36.35万
依托单位：
The University of Tokyo
依托单位国家：
日本
项目类别：
Grant-in-Aid for Scientific Research on Priority Areas
财政年份：
2000
资助国家：
日本
起止时间：
2000 至 2003
项目状态：
已结题

来源：
https://kaken.nii.ac.jp/en/grant/KAKENHI-PROJECT-12132202/
关键词：
音声合成生成過程モデル回帰木音声対話システム感情音声発話速度 HMM音声合成平均声モデル固有音声統計的基本周波数パターン生成談話情報話者適応多空間確率分布HMM パラ・非言語情報統計的F0パターン生成対話調音声 Fillerの韻律基本周波数抽出

项目摘要

種々の調子の音声を従来になく人間らしい抑揚で合成する技術を確立した上でユーザフレンドリな応答音声生成システムを構築することを目的として研究を進め、以下の成果を達成した。1.テキストを入力として、文節境界、(FOパターン生成過程モデルの)フレーズ・アクセント指令、音素長を回帰木により推定する統合的な手法を開発した。学習用コーパスのモデルの指令は、自動的に抽出しているが、フレーズ指令に制約をかけることにより抽出精度を向上させ、より良好な指令の推定を達成した。HMM音声合成に組み込み、朗読音声の他、感情音声について実験を行い、怒りの表出が適正に行われていることを確認した。2.昨年度開発した、エージェント音声対話システムで応答文の概念から音声合成を一貫して行う手法において、その韻律の面からの品質向上を行い、その効果を聴取実験により確認した。3.プレゼンテーションを想定し、書き言葉で表記された文内容から、ジェスチャータグ付き話し言葉の文を自動的に生成する手法を開発した。生成された文から音声合成を行うための韻律制御の手法を検討した。4.感情表現機能付きマルチモーダルプレゼンテーション記述言語MPMLの開発を進め、出力される感情音声の観点から評価を行った。また、試用実験により、感情音声がユーザに与える効果を調べた。5.適応技術により任意の話者・調子の音声を生成するためのHMM音声合成用平均声モデルの品質改良を行った。学習データ量が限られている場合への対処手法として、文脈クラスタと話者適応学習を導入することを行った。また、モーフィングにより、種々の話者・調子の音声の合成が可能なことを示した。6.スペクトル・F0・継続長を統一的に扱うHMM音声合成において、音素HMMの適応により感情音声を合成することを行った。聴取実験により、意図した感情が有効に伝達されることを確認した。

Kind of 々の tone の sounds を従 to になく human らしい modulation です synthesis る technology を establish した on でユーザフレンドリな応 answer sounds generated システムを build することを purpose としをめ, the following のて research を reached した. 1. テキストをと into force して, Wen Jie realm, (FO パターン generation process モデルの) フレーズ · アクセント instruction, phoneme を帰 back long wood により presumption するな technique of integration of を open 発した. Learning with コーパスのモデルの pump, automatic に instruction はしているが, フレーズ instruction に restrict をかけることにより extraction accuracy を upward させ, よりな good instruction の presumption を reached した. HMM sounds synthetic に group み込み, lang 読 sounds の he, emotional sounds について be 験をい, nu りの table が optimum is に row われていることを confirm した. 2. Yesterday's annual open 発した, エージェント sounds of words シ seaborne ステムで応 answer wen の concept から voice synthesis を consistently して line う gimmick において, その rhythm の surface からの quality line up をい, その unseen fruit を聴 take be 験により confirm した. 3. プレゼンテーションをし scenarios, the book き leaf で mark whatever された text content から, ジェスチャータグ pay き words し said leaf の article を automated にする gimmick を open 発した. Generate された text, ら sound synthesis, を lines, うため, <s:1> rhythm control, を検 to seek た. 4. The function of emotional expression pay きマルチモーダルプレゼンテーション account words MPML の open 発をめ, output される emotional sounds の観 point から review 価を line った. Youdaoplaceholder0, trial experience によによ, emotional voice がユザにザに and える effect を key べた. 5. Optimum 応 technology により arbitrary の words, tone の sounds を generated するための HMM voice synthesis with the sound of the average モデルの line quality improvement をった. Learning デーがタ quantity limit られている occasions への処 gimmick seaborne として, context クラスタと words study optimum 応を import することを line った. また, モーフィングにより, kind of 々の words, tone の sounds の synthetic が may なことを shown した. 6. スペクトル, F0, 継続 long を unified に Cha う HMM voice synthesis において, phoneme HMM の optimum 応により emotion sounds を synthetic することを line った. Youdaoplaceholder0 based on the actual experience によ聴 and the intention た emotion が has an effect に伝 to されるされるとをとを confirm that た.

项目成果

期刊论文数量（118）

专著数量（0）

科研奖励数量（0）

会议论文数量（0）

专利数量（0）

塚原渉: "Responding to subtle, fleeting changes in the user's internal state"CHI Letters. 3・1. 77-84 (2001)

Wataru Tsukahara：“响应用户内部状态的微妙、短暂的变化”CHI Letters 3・1 (2001)。

DOI：
发表时间：
期刊：
影响因子：
0
作者：
通讯作者：

田中智宏: "瞬時周波数振幅スペクトルに基づくピッチ抽出法の検討"電子情報通信学会技術報告(音声研究会). (発表予定). (2001)

Tomohiro Tanaka：“基于瞬时频率幅度谱的基音提取方法的研究”IEICE 技术报告（语音研究组）（演示文稿预定）。

DOI：
发表时间：
期刊：
影响因子：
0
作者：
通讯作者：

Keikichi Hirose: "Corpus-based synthesis of F0 contours for emotional speech using the generation process model"Proceedings 15th International Congress of Phonetic Sciences. 3. 2945-2948 (2003)

Keikichi Hirose：“使用生成过程模型基于语料库合成情感语音的 F0 轮廓”第 15 届国际语音科学大会论文集。

DOI：
发表时间：
期刊：
影响因子：
0
作者：
通讯作者：

Keikichi Hirose: "Speech prosody in spoken language processing(invited)"Proccedings International Conference on Computer and Information Technology. 1. 20-27 (2003)

广濑圭吉：《口语处理中的语音韵律（特邀）》计算机与信息技术国际会议论文集。

DOI：
发表时间：
期刊：
影响因子：
0
作者：
通讯作者：

Keikichi Hirose: "Improved corpus-based synthesis of fundamental frequency contours using generation process model"Proc. International Conference on Spoken Language Processing. 2085-2088 (2002)

Keikichi Hirose：“使用生成过程模型改进基于语料库的基频轮廓合成”Proc。

DOI：
发表时间：
期刊：
影响因子：
0
作者：
通讯作者：

DOI：
{{ item.doi }}
发表时间：
{{ item.publish_year }}
期刊：
{{ item.journal_name }}
影响因子：
{{ item.factor }}
作者：
{{ item.authors }}
通讯作者：
{{ item.author }}

数据更新时间：{{ journalArticles.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ monograph.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ sciAawards.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ conferencePapers.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ patent.updateTime }}

広瀬啓吉其他文献

生成過程モデルに基づく母語話者と中国語話者の日本語朗読音声の基本周波数パターン

基于生成过程模型的母语者和汉语者日语阅读语音的基本频率模式

DOI：
发表时间：
2007
期刊：
影响因子：
0
作者：
平野宏子;広瀬啓吉;河合剛;顧文涛;峯松信明
通讯作者：
峯松信明

音調核モデルに基づく中国語F_0パターンの2段階生成

基于声调核模型的汉语F_0模式的两步生成

DOI：
发表时间：
2006
期刊：
電子情報通信学会技術研究報告(音声研究会) SP2005-159
影响因子：
0
作者：
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬啓吉;浅野泰史;河村美由紀;孫慶華
通讯作者：
孫慶華

基本周波数パターン生成過程モデルのコーパスベースパラメータ自動抽出の評価

基于语料库的基频模式生成过程模型自动参数提取评价

DOI：
发表时间：
2006
期刊：
日本音響学会講演論文集 CD-ROM
影响因子：
0
作者：
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬啓吉;浅野泰史;河村美由紀
通讯作者：
河村美由紀

種々の調子の音声合成のための韻律制御-感情音声合成の視点から-(招待講演)

各种声调语音合成的韵律控制——从情感语音合成的角度——（特邀报告）

DOI：
发表时间：
2006
期刊：
日本音響学会講演論文集 CD-ROM
影响因子：
0
作者：
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬啓吉
通讯作者：
広瀬啓吉

文節単位での感情の程度を考慮した統計的韻律制御

考虑每个短语的情感程度的统计韵律控制

DOI：
发表时间：
2006
期刊：
日本音響学会講演論文集 CD-ROM
影响因子：
0
作者：
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬啓吉;浅野泰史
通讯作者：
浅野泰史