高品質音声合成のための韻律制御

高质量语音合成的韵律控制

基本信息

  • 批准号:
    12132202
  • 负责人:
  • 金额:
    $ 36.35万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
  • 财政年份:
    2000
  • 资助国家:
    日本
  • 起止时间:
    2000 至 2003
  • 项目状态:
    已结题

项目摘要

種々の調子の音声を従来になく人間らしい抑揚で合成する技術を確立した上でユーザフレンドリな応答音声生成システムを構築することを目的として研究を進め、以下の成果を達成した。1.テキストを入力として、文節境界、(FOパターン生成過程モデルの)フレーズ・アクセント指令、音素長を回帰木により推定する統合的な手法を開発した。学習用コーパスのモデルの指令は、自動的に抽出しているが、フレーズ指令に制約をかけることにより抽出精度を向上させ、より良好な指令の推定を達成した。HMM音声合成に組み込み、朗読音声の他、感情音声について実験を行い、怒りの表出が適正に行われていることを確認した。2.昨年度開発した、エージェント音声対話システムで応答文の概念から音声合成を一貫して行う手法において、その韻律の面からの品質向上を行い、その効果を聴取実験により確認した。3.プレゼンテーションを想定し、書き言葉で表記された文内容から、ジェスチャータグ付き話し言葉の文を自動的に生成する手法を開発した。生成された文から音声合成を行うための韻律制御の手法を検討した。4.感情表現機能付きマルチモーダルプレゼンテーション記述言語MPMLの開発を進め、出力される感情音声の観点から評価を行った。また、試用実験により、感情音声がユーザに与える効果を調べた。5.適応技術により任意の話者・調子の音声を生成するためのHMM音声合成用平均声モデルの品質改良を行った。学習データ量が限られている場合への対処手法として、文脈クラスタと話者適応学習を導入することを行った。また、モーフィングにより、種々の話者・調子の音声の合成が可能なことを示した。6.スペクトル・F0・継続長を統一的に扱うHMM音声合成において、音素HMMの適応により感情音声を合成することを行った。聴取実験により、意図した感情が有効に伝達されることを確認した。
Kind of 々 の tone の sounds を 従 to に な く human ら し い modulation で す synthesis る technology を establish し た on で ユ ー ザ フ レ ン ド リ な 応 answer sounds generated シ ス テ ム を build す る こ と を purpose と し を め, the following の て research を reached し た. 1. テ キ ス ト を と into force し て, Wen Jie realm, (FO パ タ ー ン generation process モ デ ル の) フ レ ー ズ · ア ク セ ン ト instruction, phoneme を 帰 back long wood に よ り presumption す る な technique of integration of を open 発 し た. Learning with コ ー パ ス の モ デ ル の pump, automatic に instruction は し て い る が, フ レ ー ズ instruction に restrict を か け る こ と に よ り extraction accuracy を upward さ せ, よ り な good instruction の presumption を reached し た. HMM sounds synthetic に group み 込 み, lang 読 sounds の he, emotional sounds に つ い て be 験 を い, nu り の table が optimum is に row わ れ て い る こ と を confirm し た. 2. Yesterday's annual open 発 し た, エ ー ジ ェ ン ト sounds of words シ seaborne ス テ ム で 応 answer wen の concept か ら voice synthesis を consistently し て line う gimmick に お い て, そ の rhythm の surface か ら の quality line up を い, そ の unseen fruit を 聴 take be 験 に よ り confirm し た. 3. プ レ ゼ ン テ ー シ ョ ン を し scenarios, the book き leaf で mark whatever さ れ た text content か ら, ジ ェ ス チ ャ ー タ グ pay き words し said leaf の article を automated に す る gimmick を open 発 し た. Generate された text, ら sound synthesis, を lines, うため, <s:1> rhythm control, を検 to seek た. 4. The function of emotional expression pay き マ ル チ モ ー ダ ル プ レ ゼ ン テ ー シ ョ ン account words MPML の open 発 を め, output さ れ る emotional sounds の 観 point か ら review 価 を line っ た. Youdaoplaceholder0, trial experience によ によ, emotional voice がユ ザに ザに and える effect を key べた. 5. Optimum 応 technology に よ り arbitrary の words, tone の sounds を generated す る た め の HMM voice synthesis with the sound of the average モ デ ル の line quality improvement を っ た. Learning デ ー が タ quantity limit ら れ て い る occasions へ の 処 gimmick seaborne と し て, context ク ラ ス タ と words study optimum 応 を import す る こ と を line っ た. ま た, モ ー フ ィ ン グ に よ り, kind of 々 の words, tone の sounds の synthetic が may な こ と を shown し た. 6. ス ペ ク ト ル, F0, 継 続 long を unified に Cha う HMM voice synthesis に お い て, phoneme HMM の optimum 応 に よ り emotion sounds を synthetic す る こ と を line っ た. Youdaoplaceholder0 based on the actual experience によ 聴 and the intention た emotion が has an effect に伝 to される される とを とを confirm that た.

项目成果

期刊论文数量(118)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
塚原渉: "Responding to subtle, fleeting changes in the user's internal state"CHI Letters. 3・1. 77-84 (2001)
Wataru Tsukahara:“响应用户内部状态的微妙、短暂的变化”CHI Letters 3・1 (2001)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
田中智宏: "瞬時周波数振幅スペクトルに基づくピッチ抽出法の検討"電子情報通信学会技術報告(音声研究会). (発表予定). (2001)
Tomohiro Tanaka:“基于瞬时频率幅度谱的基音提取方法的研究”IEICE 技术报告(语音研究组)(演示文稿预定)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Keikichi Hirose: "Corpus-based synthesis of F0 contours for emotional speech using the generation process model"Proceedings 15th International Congress of Phonetic Sciences. 3. 2945-2948 (2003)
Keikichi Hirose:“使用生成过程模型基于语料库合成情感语音的 F0 轮廓”第 15 届国际语音科学大会论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Keikichi Hirose: "Speech prosody in spoken language processing(invited)"Proccedings International Conference on Computer and Information Technology. 1. 20-27 (2003)
广濑圭吉:《口语处理中的语音韵律(特邀)》计算机与信息技术国际会议论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Keikichi Hirose: "Improved corpus-based synthesis of fundamental frequency contours using generation process model"Proc. International Conference on Spoken Language Processing. 2085-2088 (2002)
Keikichi Hirose:“使用生成过程模型改进基于语料库的基频轮廓合成”Proc。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

広瀬 啓吉其他文献

生成過程モデルに基づく母語話者と中国語話者の日本語朗読音声の基本周波数パターン
基于生成过程模型的母语者和汉语者日语阅读语音的基本频率模式
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    平野 宏子;広瀬 啓吉;河合 剛;顧文 涛;峯松 信明
  • 通讯作者:
    峯松 信明
音調核モデルに基づく中国語F_0パターンの2段階生成
基于声调核模型的汉语F_0模式的两步生成
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史;河村 美由紀;孫慶華
  • 通讯作者:
    孫慶華
基本周波数パターン生成過程モデルのコーパスベースパラメータ自動抽出の評価
基于语料库的基频模式生成过程模型自动参数提取评价
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史;河村 美由紀
  • 通讯作者:
    河村 美由紀
種々の調子の音声合成のための韻律制御-感情音声合成の視点から-(招待講演)
各种声调语音合成的韵律控制——从情感语音合成的角度——(特邀报告)
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉
  • 通讯作者:
    広瀬 啓吉
文節単位での感情の程度を考慮した統計的韻律制御
考虑每个短语的情感程度的统计韵律控制
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史
  • 通讯作者:
    浅野 泰史

広瀬 啓吉的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('広瀬 啓吉', 18)}}的其他基金

認知モデルと常識ベースに基づく情動を含む音声コミュニケーション
语音通信,包括基于认知模型和常识的情感
  • 批准号:
    08F08049
  • 财政年份:
    2008
  • 资助金额:
    $ 36.35万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
劣条件下の混合音響信号の分離とその音声認識への利用
恶劣条件下混合声信号的分离及其在语音识别中的应用
  • 批准号:
    06F06099
  • 财政年份:
    2006
  • 资助金额:
    $ 36.35万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
フィンランド人日本語学習者による日本語語い音調の韻律研究
芬兰日语学习者对日语声调的韵律研究
  • 批准号:
    06F05756
  • 财政年份:
    2005
  • 资助金额:
    $ 36.35万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
フィンランド人日本語学習者による日本語語い音調の韻律研究
芬兰日语学习者对日语声调的韵律研究
  • 批准号:
    05F05756
  • 财政年份:
    2005
  • 资助金额:
    $ 36.35万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
文節境界を考慮した統計的言語モデルの高度化と音声認識への利用
推进考虑子句边界及其在语音识别中的使用的统计语言模型
  • 批准号:
    16650034
  • 财政年份:
    2004
  • 资助金额:
    $ 36.35万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
中国語基本周波数パターンの分析、定式化と合成手法の開発
中国基频模式分析、合成方法的制定和发展
  • 批准号:
    04F04035
  • 财政年份:
    2004
  • 资助金额:
    $ 36.35万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
韻律に着目した音声言語情報処理の高度化
以韵律为中心的口语信息处理的复杂性
  • 批准号:
    12132101
  • 财政年份:
    2000
  • 资助金额:
    $ 36.35万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
モーラ遷移確率モデルによる韻律の表現と音声認識への利用に関する研究
基于mora转移概率模型的韵律表达及其在语音识别中的应用研究
  • 批准号:
    11878058
  • 财政年份:
    1999
  • 资助金额:
    $ 36.35万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
韻律に着目した音声言語情報処理の高度化に関する調査研究
以韵律为中心的口语信息处理进展研究
  • 批准号:
    10898014
  • 财政年份:
    1998
  • 资助金额:
    $ 36.35万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
モデルの広がりを考慮した頑健な音声認識手法の研究
考虑模型扩散的鲁棒语音识别方法研究
  • 批准号:
    09878065
  • 财政年份:
    1997
  • 资助金额:
    $ 36.35万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了