高品質音声合成のための韻律制御

高质量语音合成的韵律控制

基本信息

  • 批准号:
    12132202
  • 负责人:
  • 金额:
    $ 36.35万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
  • 财政年份:
    2000
  • 资助国家:
    日本
  • 起止时间:
    2000 至 2003
  • 项目状态:
    已结题

项目摘要

種々の調子の音声を従来になく人間らしい抑揚で合成する技術を確立した上でユーザフレンドリな応答音声生成システムを構築することを目的として研究を進め、以下の成果を達成した。1.テキストを入力として、文節境界、(FOパターン生成過程モデルの)フレーズ・アクセント指令、音素長を回帰木により推定する統合的な手法を開発した。学習用コーパスのモデルの指令は、自動的に抽出しているが、フレーズ指令に制約をかけることにより抽出精度を向上させ、より良好な指令の推定を達成した。HMM音声合成に組み込み、朗読音声の他、感情音声について実験を行い、怒りの表出が適正に行われていることを確認した。2.昨年度開発した、エージェント音声対話システムで応答文の概念から音声合成を一貫して行う手法において、その韻律の面からの品質向上を行い、その効果を聴取実験により確認した。3.プレゼンテーションを想定し、書き言葉で表記された文内容から、ジェスチャータグ付き話し言葉の文を自動的に生成する手法を開発した。生成された文から音声合成を行うための韻律制御の手法を検討した。4.感情表現機能付きマルチモーダルプレゼンテーション記述言語MPMLの開発を進め、出力される感情音声の観点から評価を行った。また、試用実験により、感情音声がユーザに与える効果を調べた。5.適応技術により任意の話者・調子の音声を生成するためのHMM音声合成用平均声モデルの品質改良を行った。学習データ量が限られている場合への対処手法として、文脈クラスタと話者適応学習を導入することを行った。また、モーフィングにより、種々の話者・調子の音声の合成が可能なことを示した。6.スペクトル・F0・継続長を統一的に扱うHMM音声合成において、音素HMMの適応により感情音声を合成することを行った。聴取実験により、意図した感情が有効に伝達されることを確認した。
这项研究的目的是建立一项技术,该技术可以用类似人类的语调综合各种音调的声音,然后构建一个用户友好的响应语音生成系统,从而实现以下结果。 1。我们已经开发了一种集成方法,用于估计子句边界,短语焦点命令(在FO模式生成过程模型中)和使用文本作为输入的回归树的音素长度。尽管训练语料库模型中的命令会自动提取,但通过将约束放在短语命令上,提高了提取精度,从而更好地估计了命令。将其纳入HMM语音综合中,我们进行了有关情感语音和阅读音频的实验,并确认愤怒得到了适当的表达。 2。去年开发的方法是为了始终如一地从响应句子的概念中使用代理语音对话系统进行响应句子的概念,提高了韵律质量,并通过聆听实验确认了这种效果。 3。我们已经开发了一种方法,该方法会根据陈述的句子自动生成带有手势标签的口语标签的口语句子。我们研究了一种从生成的句子中执行语音综合的韵律控制方法。 4。我们开发了一种具有情感表达功能的多模式演示语言MPML,并从输出情感声音的角度进行了评估。此外,一个试验实验研究了情感声音对用户的影响。 5。提高了HMM语音合成的平均语音模型的质量,以使用自适应技术为任何说话者/音调生成语音。我们介绍了上下文集群和说话者自适应学习,以此作为对学习数据量有限的情况的对策。还已经表明,变形可以综合各种说话者和音调的语音。 6。在处理频谱,F0和连续性长度的HMM语音合成中,通过调整音素HMM来综合情感语音。听力实验证实了预期的情绪是有效传播的。

项目成果

期刊论文数量(118)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Nobuaki Minematsu: "Automatic estimation of accentual attribute values of words for accent sandhi rules of Japanese text-to-speech conversion"IEICE Trans. Information and Systems. E86-D・1. 550-557 (2003)
Nobuaki Minematsu:“日语文本到语音转换的重音连读规则的单词重音属性值的自动估计”IEICE Trans. 550-557(2003)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Atsuhiro Sakurai: "Data-driven generation of F0 contours using a superpositional model"Speech Communication. 40・4. 535-549 (2003)
Atsuhiro Sakurai:“使用叠加模型的数据驱动的 F0 轮廓生成”Speech Communication 40・4(2003)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
西田悠介: "料理教示発話の構造解析"言語処理学会第9回年次大会論文集. (発表予定). (2003)
Yusuke Nishida:“烹饪教学话语的结构分析”语言处理学会第九届年会论文集(预定演讲)(2003 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
西田豊明: "Social intelligence design for knowledge creating communities"Proc. International Conference on Intelligent Agent Technology. 23-26 (2001)
Toyoaki Nishida:“知识创造社区的社会智能设计”Proc. 智能代理技术国际会议 23-26 (2001)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Masafumi Okamoto: "Quantitative estimation of the meanings of the phonetic components of back-channels"Proc. 35th Spoken Language Understanding and Discourse Workshop. 47-52 (2002)
Masafumi Okamoto:“反向通道语音成分含义的定量估计”Proc。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

広瀬 啓吉其他文献

生成過程モデルに基づく母語話者と中国語話者の日本語朗読音声の基本周波数パターン
基于生成过程模型的母语者和汉语者日语阅读语音的基本频率模式
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    平野 宏子;広瀬 啓吉;河合 剛;顧文 涛;峯松 信明
  • 通讯作者:
    峯松 信明
音調核モデルに基づく中国語F_0パターンの2段階生成
基于声调核模型的汉语F_0模式的两步生成
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史;河村 美由紀;孫慶華
  • 通讯作者:
    孫慶華
基本周波数パターン生成過程モデルのコーパスベースパラメータ自動抽出の評価
基于语料库的基频模式生成过程模型自动参数提取评价
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史;河村 美由紀
  • 通讯作者:
    河村 美由紀
種々の調子の音声合成のための韻律制御-感情音声合成の視点から-(招待講演)
各种声调语音合成的韵律控制——从情感语音合成的角度——(特邀报告)
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉
  • 通讯作者:
    広瀬 啓吉
Corpus-based extraction of F_0 contour generation process model parameters
基于语料库提取F_0轮廓生成过程模型参数
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史;河村 美由紀;孫慶華;Keikichi Hirose;Keikichi Hirose
  • 通讯作者:
    Keikichi Hirose

広瀬 啓吉的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('広瀬 啓吉', 18)}}的其他基金

認知モデルと常識ベースに基づく情動を含む音声コミュニケーション
语音通信,包括基于认知模型和常识的情感
  • 批准号:
    08F08049
  • 财政年份:
    2008
  • 资助金额:
    $ 36.35万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
劣条件下の混合音響信号の分離とその音声認識への利用
恶劣条件下混合声信号的分离及其在语音识别中的应用
  • 批准号:
    06F06099
  • 财政年份:
    2006
  • 资助金额:
    $ 36.35万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
フィンランド人日本語学習者による日本語語い音調の韻律研究
芬兰日语学习者对日语声调的韵律研究
  • 批准号:
    06F05756
  • 财政年份:
    2005
  • 资助金额:
    $ 36.35万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
フィンランド人日本語学習者による日本語語い音調の韻律研究
芬兰日语学习者对日语声调的韵律研究
  • 批准号:
    05F05756
  • 财政年份:
    2005
  • 资助金额:
    $ 36.35万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
文節境界を考慮した統計的言語モデルの高度化と音声認識への利用
推进考虑子句边界及其在语音识别中的使用的统计语言模型
  • 批准号:
    16650034
  • 财政年份:
    2004
  • 资助金额:
    $ 36.35万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
中国語基本周波数パターンの分析、定式化と合成手法の開発
中国基频模式分析、合成方法的制定和发展
  • 批准号:
    04F04035
  • 财政年份:
    2004
  • 资助金额:
    $ 36.35万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
韻律に着目した音声言語情報処理の高度化
以韵律为中心的口语信息处理的复杂性
  • 批准号:
    12132101
  • 财政年份:
    2000
  • 资助金额:
    $ 36.35万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
モーラ遷移確率モデルによる韻律の表現と音声認識への利用に関する研究
基于mora转移概率模型的韵律表达及其在语音识别中的应用研究
  • 批准号:
    11878058
  • 财政年份:
    1999
  • 资助金额:
    $ 36.35万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
韻律に着目した音声言語情報処理の高度化に関する調査研究
以韵律为中心的口语信息处理进展研究
  • 批准号:
    10898014
  • 财政年份:
    1998
  • 资助金额:
    $ 36.35万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
モデルの広がりを考慮した頑健な音声認識手法の研究
考虑模型扩散的鲁棒语音识别方法研究
  • 批准号:
    09878065
  • 财政年份:
    1997
  • 资助金额:
    $ 36.35万
  • 项目类别:
    Grant-in-Aid for Exploratory Research

相似海外基金

機械学習とドメイン知識を導入した攻撃生成過程のモデル化と実データによる検証
使用机器学习和领域知识对攻击生成过程进行建模,并使用真实数据进行验证
  • 批准号:
    23K21670
  • 财政年份:
    2024
  • 资助金额:
    $ 36.35万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Strategies for next-generation flavivirus vaccine development
下一代黄病毒疫苗开发策略
  • 批准号:
    10751480
  • 财政年份:
    2024
  • 资助金额:
    $ 36.35万
  • 项目类别:
Centrally-linked longitudinal peripheral biomarkers of AD in multi-ethnic populations
多种族人群中 AD 的中心连锁纵向外周生物标志物
  • 批准号:
    10555723
  • 财政年份:
    2023
  • 资助金额:
    $ 36.35万
  • 项目类别:
Molecular basis of glycan recognition by T and B cells
T 和 B 细胞识别聚糖的分子基础
  • 批准号:
    10549648
  • 财政年份:
    2023
  • 资助金额:
    $ 36.35万
  • 项目类别:
Center of Research Translation on Osteoporosis Bone Anabolic Therapies
骨质疏松症骨合成代谢疗法研究转化中心
  • 批准号:
    10404412
  • 财政年份:
    2023
  • 资助金额:
    $ 36.35万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了