高品質音声合成のための韻律制御
高质量语音合成的韵律控制
基本信息
- 批准号:12132202
- 负责人:
- 金额:$ 36.35万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas
- 财政年份:2000
- 资助国家:日本
- 起止时间:2000 至 2003
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
種々の調子の音声を従来になく人間らしい抑揚で合成する技術を確立した上でユーザフレンドリな応答音声生成システムを構築することを目的として研究を進め、以下の成果を達成した。1.テキストを入力として、文節境界、(FOパターン生成過程モデルの)フレーズ・アクセント指令、音素長を回帰木により推定する統合的な手法を開発した。学習用コーパスのモデルの指令は、自動的に抽出しているが、フレーズ指令に制約をかけることにより抽出精度を向上させ、より良好な指令の推定を達成した。HMM音声合成に組み込み、朗読音声の他、感情音声について実験を行い、怒りの表出が適正に行われていることを確認した。2.昨年度開発した、エージェント音声対話システムで応答文の概念から音声合成を一貫して行う手法において、その韻律の面からの品質向上を行い、その効果を聴取実験により確認した。3.プレゼンテーションを想定し、書き言葉で表記された文内容から、ジェスチャータグ付き話し言葉の文を自動的に生成する手法を開発した。生成された文から音声合成を行うための韻律制御の手法を検討した。4.感情表現機能付きマルチモーダルプレゼンテーション記述言語MPMLの開発を進め、出力される感情音声の観点から評価を行った。また、試用実験により、感情音声がユーザに与える効果を調べた。5.適応技術により任意の話者・調子の音声を生成するためのHMM音声合成用平均声モデルの品質改良を行った。学習データ量が限られている場合への対処手法として、文脈クラスタと話者適応学習を導入することを行った。また、モーフィングにより、種々の話者・調子の音声の合成が可能なことを示した。6.スペクトル・F0・継続長を統一的に扱うHMM音声合成において、音素HMMの適応により感情音声を合成することを行った。聴取実験により、意図した感情が有効に伝達されることを確認した。
The sound of the voice is coming from the human body. The sound of the voice is coming from the human body. The sound is coming from the human body. 1. Introduction of phoneme length, text boundary, FO generation process, and estimation of integration. The instruction for learning is automatically extracted, the instruction is restricted, the extraction accuracy is improved, and the estimation of good instruction is achieved. HMM sound synthesis is composed of sound, other sound, emotional sound, anger and expression. 2. In the past year, the concept of voice response system was developed, and the quality of voice synthesis was improved. 3. The method of automatic generation of text is developed by setting the content of the text, writing the text, and writing the text. The method of generating and controlling rhythm is discussed. 4. The development of MPML for emotional expression function Fu Try it out, try it out. 5. Appropriate technology to improve the quality of average sound for HMM sound synthesis The amount of learning is limited to the situation, the method of handling, the context of learning, and the introduction of learning. It is possible to synthesize the sound of the tone. 6. Select the word F0 and the length of HMM to synthesize the sound, and the phoneme to synthesize the sound. The feeling of love and affection is confirmed.
项目成果
期刊论文数量(118)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
塚原渉: "Responding to subtle, fleeting changes in the user's internal state"CHI Letters. 3・1. 77-84 (2001)
Wataru Tsukahara:“响应用户内部状态的微妙、短暂的变化”CHI Letters 3・1 (2001)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
田中智宏: "瞬時周波数振幅スペクトルに基づくピッチ抽出法の検討"電子情報通信学会技術報告(音声研究会). (発表予定). (2001)
Tomohiro Tanaka:“基于瞬时频率幅度谱的基音提取方法的研究”IEICE 技术报告(语音研究组)(演示文稿预定)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Keikichi Hirose: "Corpus-based synthesis of F0 contours for emotional speech using the generation process model"Proceedings 15th International Congress of Phonetic Sciences. 3. 2945-2948 (2003)
Keikichi Hirose:“使用生成过程模型基于语料库合成情感语音的 F0 轮廓”第 15 届国际语音科学大会论文集。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Keikichi Hirose: "Speech prosody in spoken language processing(invited)"Proccedings International Conference on Computer and Information Technology. 1. 20-27 (2003)
广濑圭吉:《口语处理中的语音韵律(特邀)》计算机与信息技术国际会议论文集。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Keikichi Hirose: "Improved corpus-based synthesis of fundamental frequency contours using generation process model"Proc. International Conference on Spoken Language Processing. 2085-2088 (2002)
Keikichi Hirose:“使用生成过程模型改进基于语料库的基频轮廓合成”Proc。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
広瀬 啓吉其他文献
生成過程モデルに基づく母語話者と中国語話者の日本語朗読音声の基本周波数パターン
基于生成过程模型的母语者和汉语者日语阅读语音的基本频率模式
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
平野 宏子;広瀬 啓吉;河合 剛;顧文 涛;峯松 信明 - 通讯作者:
峯松 信明
音調核モデルに基づく中国語F_0パターンの2段階生成
基于声调核模型的汉语F_0模式的两步生成
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史;河村 美由紀;孫慶華 - 通讯作者:
孫慶華
基本周波数パターン生成過程モデルのコーパスベースパラメータ自動抽出の評価
基于语料库的基频模式生成过程模型自动参数提取评价
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史;河村 美由紀 - 通讯作者:
河村 美由紀
種々の調子の音声合成のための韻律制御-感情音声合成の視点から-(招待講演)
各种声调语音合成的韵律控制——从情感语音合成的角度——(特邀报告)
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉 - 通讯作者:
広瀬 啓吉
文節単位での感情の程度を考慮した統計的韻律制御
考虑每个短语的情感程度的统计韵律控制
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史 - 通讯作者:
浅野 泰史
広瀬 啓吉的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('広瀬 啓吉', 18)}}的其他基金
認知モデルと常識ベースに基づく情動を含む音声コミュニケーション
语音通信,包括基于认知模型和常识的情感
- 批准号:
08F08049 - 财政年份:2008
- 资助金额:
$ 36.35万 - 项目类别:
Grant-in-Aid for JSPS Fellows
劣条件下の混合音響信号の分離とその音声認識への利用
恶劣条件下混合声信号的分离及其在语音识别中的应用
- 批准号:
06F06099 - 财政年份:2006
- 资助金额:
$ 36.35万 - 项目类别:
Grant-in-Aid for JSPS Fellows
フィンランド人日本語学習者による日本語語い音調の韻律研究
芬兰日语学习者对日语声调的韵律研究
- 批准号:
06F05756 - 财政年份:2005
- 资助金额:
$ 36.35万 - 项目类别:
Grant-in-Aid for JSPS Fellows
フィンランド人日本語学習者による日本語語い音調の韻律研究
芬兰日语学习者对日语声调的韵律研究
- 批准号:
05F05756 - 财政年份:2005
- 资助金额:
$ 36.35万 - 项目类别:
Grant-in-Aid for JSPS Fellows
文節境界を考慮した統計的言語モデルの高度化と音声認識への利用
推进考虑子句边界及其在语音识别中的使用的统计语言模型
- 批准号:
16650034 - 财政年份:2004
- 资助金额:
$ 36.35万 - 项目类别:
Grant-in-Aid for Exploratory Research
中国語基本周波数パターンの分析、定式化と合成手法の開発
中国基频模式分析、合成方法的制定和发展
- 批准号:
04F04035 - 财政年份:2004
- 资助金额:
$ 36.35万 - 项目类别:
Grant-in-Aid for JSPS Fellows
韻律に着目した音声言語情報処理の高度化
以韵律为中心的口语信息处理的复杂性
- 批准号:
12132101 - 财政年份:2000
- 资助金额:
$ 36.35万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
モーラ遷移確率モデルによる韻律の表現と音声認識への利用に関する研究
基于mora转移概率模型的韵律表达及其在语音识别中的应用研究
- 批准号:
11878058 - 财政年份:1999
- 资助金额:
$ 36.35万 - 项目类别:
Grant-in-Aid for Exploratory Research
韻律に着目した音声言語情報処理の高度化に関する調査研究
以韵律为中心的口语信息处理进展研究
- 批准号:
10898014 - 财政年份:1998
- 资助金额:
$ 36.35万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
モデルの広がりを考慮した頑健な音声認識手法の研究
考虑模型扩散的鲁棒语音识别方法研究
- 批准号:
09878065 - 财政年份:1997
- 资助金额:
$ 36.35万 - 项目类别:
Grant-in-Aid for Exploratory Research
相似海外基金
FlexNIR-PD: A resource efficient UK-based production process for patented flexible Near Infrared Sensors for LIDAR, Facial recognition and high-speed data retrieval
FlexNIR-PD:基于英国的资源高效生产工艺,用于 LIDAR、面部识别和高速数据检索的专利柔性近红外传感器
- 批准号:
10098113 - 财政年份:2024
- 资助金额:
$ 36.35万 - 项目类别:
Collaborative R&D
An innovative UK-based thermoplastic carbon/titanium bicycle frame production process that can reduce lead time by 90% and carbon emissions by 70%
An%20创新%20英国%20热塑性%20碳/钛%20自行车%20框架%20生产%20工艺%20that%20can%20减少%20铅%20时间%20by%2090%%20和%20碳%20排放%20by%2070%
- 批准号:
10092387 - 财政年份:2024
- 资助金额:
$ 36.35万 - 项目类别:
Collaborative R&D
SBIR Phase II: Portable Production Process for Icy Regoliths by Vapor Deposition
SBIR 第二阶段:通过气相沉积生产冰风化层的便携式生产工艺
- 批准号:
2231348 - 财政年份:2023
- 资助金额:
$ 36.35万 - 项目类别:
Cooperative Agreement
Feasibility study on improving video production process using data-efficient Generative-AI models
使用数据高效的生成人工智能模型改进视频制作流程的可行性研究
- 批准号:
10081373 - 财政年份:2023
- 资助金额:
$ 36.35万 - 项目类别:
Collaborative R&D
Optimization and Scale-Up of Graphene Oxide (GO) Ink Production Process
氧化石墨烯 (GO) 油墨生产工艺的优化和放大
- 批准号:
CCARD-2022-00637 - 财政年份:2022
- 资助金额:
$ 36.35万 - 项目类别:
CCI Applied Research and Development Grants
Improvement of energy efficiency and environmental footprint of Al production process, Phase III: Carbon Anode process
提高铝生产过程的能源效率和环境足迹,第三阶段:碳阳极过程
- 批准号:
557053-2020 - 财政年份:2022
- 资助金额:
$ 36.35万 - 项目类别:
Alliance Grants
Electro-fuel production process design in low-carbon energy systems
低碳能源系统中的电燃料生产工艺设计
- 批准号:
RGPIN-2021-03805 - 财政年份:2022
- 资助金额:
$ 36.35万 - 项目类别:
Discovery Grants Program - Individual
Using electrical tomography to monitor real time LIB production process
使用电断层扫描实时监控锂离子电池生产过程
- 批准号:
10031610 - 财政年份:2022
- 资助金额:
$ 36.35万 - 项目类别:
BEIS-Funded Programmes
Development of a New Poly-L-Lactic Acid Polymer Textile and Material Production Process Using Food Waste as Feedstock
以餐厨垃圾为原料的新型聚左旋乳酸聚合物纺织品及材料生产工艺的开发
- 批准号:
566989-2021 - 财政年份:2022
- 资助金额:
$ 36.35万 - 项目类别:
Applied Research and Development Grants - Level 2
Optimization and Piloting of Novel Furfural Production Process from Biomas
生物质糠醛生产新工艺优化及中试
- 批准号:
570917-2021 - 财政年份:2022
- 资助金额:
$ 36.35万 - 项目类别:
Applied Research and Development Grants - Level 2














{{item.name}}会员




