フレキシブルなインターフェースを有する調音音声合成システムの開発

具有灵活接口的发音语音合成系统的开发

基本信息

  • 批准号:
    16760331
  • 负责人:
  • 金额:
    $ 2.3万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2004
  • 资助国家:
    日本
  • 起止时间:
    2004 至 2005
  • 项目状态:
    已结题

项目摘要

現在主流となっている波形接続方式の音声合成では,部分的な合成音の品質は優れているものの,連続音での不自然性や声質変換や話速制御などの融通性に問題がある。これに対し,音声生成過程に基づいた手法は,人間がしゃべるメカニズムを模倣した声帯や声道のモデルに基づいているため,融通性の高い次世代インターフェースとしてのポテンシャルを有している。平成17年度は,前年度に作成したGUIによるパラメータ操作が可能な合成システムの開発と,シミュレーションの効率的な運用のためCUI方式のシステム開発を継続して進め,声帯振動音源の実装による有声音声の生成など,その高度化を進めた。これにより,合成できる子音数を増やすことが可能になった。また,シミュレータを用いて,声帯振動や子音閉鎖,および解放の時刻の調整実験を行うことで,より良好な子音生成のための条件の導出を行った。更に,子音の断面積データを過去の文献等を参考に決定し,日本語50音の合成実験を行い,ほぼ認識できる音質の合成音を生成することが可能となった。音声合成システムでは,声道の直円筒管表示の形態をとっているが,実際の3次元の声道形状との位置的対応関係の把握が容易ではないという問題があった。このため,擬似的ではあるが,3次元の声道形状表示ツールを新たに開発した。このツールではMRIデータを基に正中矢状面における声道輪郭を抽出し,声道断面積を円や楕円で表すα-βモデルで表現している。このツールの開発により,より少ない制御パラメータで音声合成システムを駆動する仕組みも実現することができた。
Now the mainstream waveform connection mode of sound synthesis, part of the synthesis of sound quality, even the sound of unnatural quality, voice quality change, speed control and compatibility problems. The sound generation process is based on the sound generation method, and the sound generation process is based on the sound generation method, and the sound generation process is based on the sound generation method. In 2017, the GUI was created in the previous year, and the development of the possible synthesis mode was improved. The development of the sound generation mode was improved in the implementation of the sound vibration source. The number of consonants in a compound is increased. The sound band vibration and tone lock are used to adjust the time of release, and the conditions for good tone generation are derived. In addition, the cross-section area of the consonant is determined by reference to the past literature, etc., and the synthesis of the Japanese 50 sounds is carried out, so that the sound quality of the synthesized sound can be recognized. Sound synthesis system, sound channel straight tube representation of the shape of the relationship between the actual three-dimensional sound channel shape and position of the grasp of the problem is easy. This is the third dimension of sound track shape representation. In the mid-sagittal plane, the sound track is extracted, and the cross-sectional area of the sound track is expressed as α-β. This is the first time I've ever seen a voice in a room.

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A Web-based articulatory speech synthesis system for distance education
基于网络的远程教育发音语音合成系统
A study of speech synthesis based on speech production process by using cascaded first-order systems
基于级联一阶系统语音产生过程的语音合成研究
縦続1次系に基づく音声合成-プログラマブル・システムの実現に向けた開発-
基于级联一阶系统的语音合成-向可编程系统实现的发展-
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

緒方 公一其他文献

緒方 公一的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('緒方 公一', 18)}}的其他基金

データの軌跡情報からの兆候検出と意図の推定の融合による判断制御支援に関する研究
数据轨迹信息症状检测与意图估计相结合的决策控制支持研究
  • 批准号:
    21K04081
  • 财政年份:
    2021
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
調音における話速変換規則の導出と音声合成システムへの応用
发音中语速转换规则的推导及其在语音合成系统中的应用
  • 批准号:
    13750394
  • 财政年份:
    2001
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
調音器官とその運動のモデル化に関する研究
关节器官及其运动建模研究
  • 批准号:
    09750514
  • 财政年份:
    1997
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
調音運動の時間構造とモデル化に関する研究
发音运动的时间结构和建模研究
  • 批准号:
    08750549
  • 财政年份:
    1996
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
磁気センサを用いた調音運動計測システムの開発研究
利用磁传感器的关节运动测量系统的研发
  • 批准号:
    07750511
  • 财政年份:
    1995
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

複数の調音運動データを中間情報とするマルチモーダル音声合成
使用多个发音运动数据作为中间信息的多模态语音合成
  • 批准号:
    22K12100
  • 财政年份:
    2022
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
調音運動の発達と音韻知覚への影響
发音运动的发展及其对语音感知的影响
  • 批准号:
    12J08436
  • 财政年份:
    2012
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
調音運動の時間構造とモデル化に関する研究
发音运动的时间结构和建模研究
  • 批准号:
    08750549
  • 财政年份:
    1996
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
磁気センサを用いた調音運動計測システムの開発研究
利用磁传感器的关节运动测量系统的研发
  • 批准号:
    07750511
  • 财政年份:
    1995
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
下顎調音運動に対する咬筋筋紡錘由来の求心性情報の役割
咬肌肌梭传入信息对下颌关节运动的作用
  • 批准号:
    05857224
  • 财政年份:
    1993
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
調音運動の特徴抽出と調音機構の解析
关节运动特征提取及关节机制分析
  • 批准号:
    63608508
  • 财政年份:
    1988
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
調音運動の観測と定式化にもとづく連続音声合成方式
基于观察和表达发音运动的连续语音合成方法
  • 批准号:
    X00090----558009
  • 财政年份:
    1980
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了