調音における話速変換規則の導出と音声合成システムへの応用

发音中语速转换规则的推导及其在语音合成系统中的应用

基本信息

  • 批准号:
    13750394
  • 负责人:
  • 金额:
    $ 1.02万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2001
  • 资助国家:
    日本
  • 起止时间:
    2001 至 2002
  • 项目状态:
    已结题

项目摘要

本研究は,話速を変えた場合の調音運動データの収集・評価を通して,話速変換が可能で自然性の高い合成音声が生成できるシステムを実現することを目的とする。この目的のため,GUIベースの音声合成システムの開発改良を進めた。このシステムでは,高次系の近似関数の一つとしても用いられる縦続1次系関数を調音運動軌跡の表現に利用することで,滑らかな断面積変化を実現した。また,断面積変化の開始時刻をコントロールするパラメータを導入することで,話速変化も可能なシステムとなっている。声道形状変化のアニメーション機能を含めて,音声合成システムをノートパソコン上に構築し,デモンストレーションの環境も整備している。このGUIシステムでは,母音,および連続母音の合成を取り扱ったが,本年度は無声子音や破裂音の合成も可能な子音合成シミュレータの開発も行った。子音を含む調音運動軌跡に対して縦続1次系関数が良好な近似関数となることを利用して,時間的な断面積変化を表現した。合成音の品質には改良の余地はあるものの,聴覚的には認識できる合成音が生成できた。今後,音質の改良に向けて更に研究を進める予定である。これらの研究業績の一部は,Webベースの音声合成システムの開発にも結びついており,Webブラウザを介して,母音,連続母音の合成を体験できるシステムの作成も行った。
This study aims to explore the possibility of natural and synthetic sound generation through the collection and evaluation of tuning motion in different speech speed situations. For this purpose,GUI development of sound synthesis system has been improved. In this case, the approximate relationship of the higher order system is used in the performance of the tuning motion trajectory, and the sliding area is changed. For example, the start time of cross-section area change may be changed from time to time. Sound track shape change and environment change function are included, and sound synthesis system is used to construct sound track shape change and environment change. This year, the development of the synthesis of silent consonants and broken consonants is possible. The first order correlation of the phonon contains the tuning trajectory, and the second order correlation is good. There is room for improvement in the quality of synthetic sound, and the quality of synthetic sound is recognized. In the future, the improvement of sound quality will be further studied. As part of this research effort, the development of sound synthesis systems for Web applications has been successfully completed, and the development of sound synthesis systems for Web applications has been successfully completed.

项目成果

期刊论文数量(11)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Kohichi Ogata: "Development of a GUI-based articulatory speech synthesis system"Proceedings of International Conference on Spoken Language Processing (ICSLP2002). 1517-1520 (2002)
Kohichi Ogata:“基于 GUI 的发音合成系统的开发”国际口语处理会议 (ICSLP2002) 论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
緒方公一: "調音に基づく音声合成システムの開発-システムの高機能化とWeb対応-"日本音響学会2002年秋季研究発表会講演論文集-I-. 313-314 (2002)
Koichi Ogata:“基于发音的语音合成系统的开发 - 系统的高功能性和网络支持 -”日本声学学会 2002 年秋季研究会议记录 - I - 313-314 (2002)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
中山智武: "音声生成過程に基づいた音声合成シミュレータの開発"第17回熊本県産学官技術交流会講演論文集. 314-315 (2003)
中山富武:“基于语音生成过程的语音合成模拟器的开发”第17届熊本县产学官技术交流会论文集314-315(2003年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
緒方公一: "MRIによる声道形状の抽出と音声合成シミュレータによる声道断面積の補正"平成13年度電気関係学会九州支部連合大会論文集. 475 (2001)
Koichi Ogata:“使用 MRI 提取声道形状并使用语音合成模拟器校正声道横截面积”2001 年日本电气工程师九州分会联合会会议记录,475(2001)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
緒方公一: "調音に基づく音声合成システム-GUIを用いたシステムの開発-"電子情報通信学会技術研究報告. 102・292. 29-34 (2002)
Koichi Ogata:“基于发音的语音合成系统 - 使用 GUI 的系统开发 -” IEICE 技术研究报告 102・292(2002)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

緒方 公一其他文献

緒方 公一的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('緒方 公一', 18)}}的其他基金

データの軌跡情報からの兆候検出と意図の推定の融合による判断制御支援に関する研究
数据轨迹信息症状检测与意图估计相结合的决策控制支持研究
  • 批准号:
    21K04081
  • 财政年份:
    2021
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
フレキシブルなインターフェースを有する調音音声合成システムの開発
具有灵活接口的发音语音合成系统的开发
  • 批准号:
    16760331
  • 财政年份:
    2004
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
調音器官とその運動のモデル化に関する研究
关节器官及其运动建模研究
  • 批准号:
    09750514
  • 财政年份:
    1997
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
調音運動の時間構造とモデル化に関する研究
发音运动的时间结构和建模研究
  • 批准号:
    08750549
  • 财政年份:
    1996
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
磁気センサを用いた調音運動計測システムの開発研究
利用磁传感器的关节运动测量系统的研发
  • 批准号:
    07750511
  • 财政年份:
    1995
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

複数の調音運動データを中間情報とするマルチモーダル音声合成
使用多个发音运动数据作为中间信息的多模态语音合成
  • 批准号:
    22K12100
  • 财政年份:
    2022
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
調音運動の発達と音韻知覚への影響
发音运动的发展及其对语音感知的影响
  • 批准号:
    12J08436
  • 财政年份:
    2012
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
調音運動の時間構造とモデル化に関する研究
发音运动的时间结构和建模研究
  • 批准号:
    08750549
  • 财政年份:
    1996
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
磁気センサを用いた調音運動計測システムの開発研究
利用磁传感器的关节运动测量系统的研发
  • 批准号:
    07750511
  • 财政年份:
    1995
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
下顎調音運動に対する咬筋筋紡錘由来の求心性情報の役割
咬肌肌梭传入信息对下颌关节运动的作用
  • 批准号:
    05857224
  • 财政年份:
    1993
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
調音運動の特徴抽出と調音機構の解析
关节运动特征提取及关节机制分析
  • 批准号:
    63608508
  • 财政年份:
    1988
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
調音運動の観測と定式化にもとづく連続音声合成方式
基于观察和表达发音运动的连续语音合成方法
  • 批准号:
    X00090----558009
  • 财政年份:
    1980
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了