自然なヒューマンコンピュータインタラクションのための話し言葉会話音声合成

自然人机交互的口语对话语音合成

基本信息

  • 批准号:
    13J08776
  • 负责人:
  • 金额:
    $ 1.47万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2013
  • 资助国家:
    日本
  • 起止时间:
    2013-04-01 至 2015-03-31
  • 项目状态:
    已结题

项目摘要

今日まで音声合成で広く研究の対象となっていたものは朗読調・アナウンス調の音声であった。近年の研究により、比較的低コストで楽しげや怒りといった感情表現・発話様式を再現することが可能であることが報告されているが、日常会話で用いられるような話し言葉調の自然な音声を合成できるまでには至っていない。その理由として、自発的な会話音声に含まれる疑問や確認などの発話意図や「ああ」「うん」などのフィラーといった多様な表現を実現するための、データベースの構築・音声の説明変数の選択・モデル化手法に対して十分な検討が行われていないという問題点がある。研究代表者は隠れマルコフモデルに基づく音声合成(HMM音声合成)を話し言葉調の音声に適用する手法として、従来手法である音素単位のモデル化に対し、疑問に含まれる上昇調などの韻律的イベントを単位とするモデル化手法を提案した。しかし、HMM音声合成における状態単位のモデル化という制約から自然な話し言葉会話音声の生成には至らなかった。そこで、本研究ではHMMのように状態単位ではなくフレーム単位で音声をモデル化するガウス過程回帰に基づく新たな音声合成手法(GPR音声合成)を提案した。読み上げ調の音声に対し、音声の音韻を表すスペクトルおよび韻律を表すF0のモデル化を行い、従来のHMM音声合成に比べ自然性の高い音声を合成できることを示した。GPR音声合成は柔軟性の高い手法であり、話し言葉に特有の入力変数の導入が容易であることから、今後話し言葉会話音声における自然性の向上に繋がると考えられる。
Today's sound synthesis is a study of the image and sound of the sound. In recent years, research has been conducted to compare the low level of emotional expression, speech pattern reproduction, and daily conversation. The reason for this is that the self-generated voice contains questions, confirms the meaning of the voice, and implements the structure of the voice. The number of voice descriptions is selected. The method of conversion is very difficult to solve. Research representatives proposed methods for the application of HMM sound synthesis to speech tone and phoneme units, including the application of HMM sound synthesis to phoneme units, and the application of HMM sound synthesis to phoneme units, phoneme units, and phoneme units. HMM sound synthesis status status In this study, we propose a new sound-to-sound synthesis method (GPR sound-to-sound synthesis). The sound of the upper tone, the sound of the sound GPR sound synthesis is soft and easy to import, and the natural sound synthesis is easy to import.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Statistical nonparametric speech synthesis using sparse Gaussian processes
  • DOI:
    10.21437/interspeech.2013-121
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tomoki Koriyama;Takashi Nose;Takao Kobayashi
  • 通讯作者:
    Tomoki Koriyama;Takashi Nose;Takao Kobayashi
Parametric speech synthesis based on Gaussian process regression using global variance and hyperparameter optimization
基于使用全局方差和超参数优化的高斯过程回归的参数语音合成
スパース近似と畳み込みカーネルを用いたガウス過程回帰に基づく音声合成
使用稀疏近似和卷积核的基于高斯过程回归的语音合成
Prosody generation using frame-based Gaussian process regression and classification for statistical parametric speech synthesis
Statistical Parametric Speech Synthesis Based on Gaussian Process Regression
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

郡山 知樹其他文献

インタラクション分析に基づく科学コミュニケーションのリ・デザイン.
基于交互分析重新设计科学传播。
GPR音声合成におけるスタイル適応の検討
GPR语音合成中的风格适应研究
音声合成のためのCRF/HMMに基づく自動アクセント推定の評価
基于CRF/HMM的语音合成自动口音估计评估
ガウス過程回帰に基づく音声合成システムの評価
基于高斯过程回归的语音合成系统评估
Moment-matching networkに基づく一期一会音声合成における発話間ゆらぎの評価
基于矩匹配网络的千载难逢的语音合成中话语间波动评估
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    高道 慎之介;郡山 知樹;齋藤 佑樹;猿渡 洋
  • 通讯作者:
    猿渡 洋

郡山 知樹的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('郡山 知樹', 18)}}的其他基金

Speech Processing Based on Deep Gaussian Process With Stochastic Differential Equation Layers
基于随机微分方程层深度高斯过程的语音处理
  • 批准号:
    21K11955
  • 财政年份:
    2021
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似海外基金

初期ドイツモード雑誌テクストの言語的特徴とはー話し言葉性とテクストタイプの研究
早期德国时尚杂志文本的语言特征是什么?口语和文本类型的研究。
  • 批准号:
    24K16056
  • 财政年份:
    2024
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
日本人中国語学習者の書き言葉と話し言葉における言語特徴の分析
日本汉语学习者书面语和口语的语言特征分析
  • 批准号:
    23K18866
  • 财政年份:
    2023
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
脳科学・認知科学による人間に近いモデルに基づく日本語話し言葉解析器の構築と検証
基于脑科学和认知科学的类人模型日语口语分析仪的构建与验证
  • 批准号:
    21K18115
  • 财政年份:
    2021
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Pioneering)
工学系話し言葉コーパスの構築及びそれに基づく教材開発支援
工程口语语料库建设及支撑教材开发
  • 批准号:
    21652050
  • 财政年份:
    2009
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
日本語話し言葉における「係り先の不在」現象に関する実証的研究
日语口语“参照点缺失”现象的实证研究
  • 批准号:
    09J03227
  • 财政年份:
    2009
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
話し言葉音声の高度化に関する研究
口语复杂性研究
  • 批准号:
    07J10096
  • 财政年份:
    2007
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
「非母語話者による日本語話し言葉コーパス」における印象評定と音声的特徴
“非母语日语口语语料库”中的印象评分和语音特征
  • 批准号:
    18720138
  • 财政年份:
    2006
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
話し言葉音声の効率的なアーカイブ処理と対話的な検索
口语音频的高效归档和交互式检索
  • 批准号:
    05J02201
  • 财政年份:
    2005
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
話し言葉音声認識のための発話速度変動に頑健な音響モデルの開発
开发对语速波动具有鲁棒性的声学模型,用于口语语音识别
  • 批准号:
    16700171
  • 财政年份:
    2004
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
コーパスに基づく話し言葉文体論の構築
基于语料库的口语文体构建
  • 批准号:
    16652031
  • 财政年份:
    2004
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了