同時通訳のための音声合成に関する研究
同声传译语音合成研究
基本信息
- 批准号:14J10354
- 负责人:
- 金额:$ 1.02万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2014
- 资助国家:日本
- 起止时间:2014-04-25 至 2016-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本年度は,① 高速かつ高音質な音声合成・声質変換の実現,及び,②元話者の声質をできる限り反映する英語音声合成に着手した.①は,同時通訳の実現に必要不可欠な技術である.現在の主流である統計的音声合成は,少ない計算時間で音声を合成する利点を持つが,著しく音質の低い音声を生成する.この音質劣化問題に対して,我々は昨年度までに,変調スペクトルに基づくフィルタ法と音声パラメータ生成法を提案し,有効性を確認した.しかしながら,これらの手法により生成時間の増加は免れない.そこで,本年度は,変調スペクトル制約の下で音声合成器を学習する手法を提案した.実験的評価により,従来の計算時間を保持しながら,変調スペクトルの考慮による音質改善効果を得られることを確認した.また,変調スペクトルの効果を多言語音声合成において確認するため,インド言語の音声を合成する国際コンペティションに参加した.その結果,いくつかの言語において,変調スペクトルに基づく手法が世界最高品質だと評価された.②は,同時通訳で生成される合成音声に,元話者(例えば,講演者)の声質を反映する技術である.ある言語の話者の声質を別言語(ターゲット言語)の音声に反映するクロスリンガル音声合成が従来存在するが,合成音声の声質は,元話者の声質と大きく異なる.そこで我々は,声質をできるだけ反映する方法として,元話者の発話した非流暢なターゲット言語音声を用いて,ターゲット言語の合成音声を生成する方法を提案した.本年度は,元話者を日本語話者,ターゲット言語を英語に絞り研究を実施した.実験的評価の結果,非流暢な英語音声の音韻・韻律的特徴を補正することで,声質を保存したまま,自然な英語音声を合成できることを確認した.
This year, we have started to study the synthesis of English sound with high speed, high quality and sound quality. (1) At the same time, it is necessary not to lack technology. Now the mainstream statistics of sound synthesis, less calculation time, sound synthesis, good point, sound quality, low sound generation. To solve this problem, we propose a new method of sound generation. The time of creation is increasing and the method of creation is increasing. This year, we are proposing a new approach to sound synthesizer learning under the control of sound synthesizer. The evaluation of the sound quality is very important, and the calculation time of the sound quality is kept. The result of the speech synthesis is confirmed. As a result, the language is the highest quality in the world. (2) At the same time, the voice quality of the speaker (e.g., speaker) is reflected in the synthesized voice. The voice quality of the speaker is different from the voice quality of the speaker. A method for generating synthetic speech sounds is proposed. This year, Japanese speakers are studying English. As a result of the evaluation, the phoneme and prosody characteristics of non-fluent English sounds are corrected, and the sound quality is preserved.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Modulation spectrum-based post-filter for GMM-based Voice Conversion
- DOI:10.1109/apsipa.2014.7041540
- 发表时间:2014-12
- 期刊:
- 影响因子:0
- 作者:Shinnosuke Takamichi;T. Toda;A. Black;Satoshi Nakamura
- 通讯作者:Shinnosuke Takamichi;T. Toda;A. Black;Satoshi Nakamura
日本人英語音声合成における話者性を保持した韻律補正
在日语-英语语音合成中保留说话人特征的韵律校正
- DOI:
- 发表时间:2014
- 期刊:
- 影响因子:0
- 作者:大島 悠司;高道 慎之介;戸田 智基;Graham Neubig;Sakriani Sakti;中村 哲
- 通讯作者:中村 哲
コーヒーブレーク: z変換の概念と考え方を教えてください
茶歇:请告诉我们z变换的概念和思考方式。
- DOI:
- 发表时间:2014
- 期刊:
- 影响因子:0
- 作者:Y. Nakamura;K. Shimazoe;H. Takahashi;照屋絵理,吉永尚孝,東山幸司;岡田紅理子;高道 慎之介
- 通讯作者:高道 慎之介
統計的パラメトリック音声合成のための変調スペクトルに基づく音質改善法
基于调制频谱的统计参数语音合成音质改善方法
- DOI:
- 发表时间:2015
- 期刊:
- 影响因子:0
- 作者:高道 慎之介;戸田 智基;Alan W. Black;中村哲
- 通讯作者:中村哲
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
高道 慎之介其他文献
変調スペクトルを考慮したHMM音声合成
考虑调制频谱的HMM语音合成
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
Tomoyoshi Nakayama;Shigeto Seno;Yoichi Takenaka;Hideo Matsuda;清水 邦義 ら;高道 慎之介 - 通讯作者:
高道 慎之介
Transformerを用いたオノマトペからの環境音合成
使用 Transformer 从拟声词合成环境声音
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
岡本 悠希;井本 桂右;高道 慎之介;山西 良典;福森 隆寛;山下 洋一 - 通讯作者:
山下 洋一
Anytime Guarantees Under Heavy-Tailed Data
重尾数据下的随时保证
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
岡本 悠希;井本 桂右;高道 慎之介;山西 良典;山下 洋一;Matthew J. Holland - 通讯作者:
Matthew J. Holland
低電圧駆動単一磁束量子回路における論理ゲートのタイミングパラメータの解析
低压驱动单通量量子电路逻辑门时序参数分析
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
齋藤 佑樹;高道 慎之介;猿渡 洋;国吉真波 - 通讯作者:
国吉真波
Moment-matching networkに基づく一期一会音声合成における発話間ゆらぎの評価
基于矩匹配网络的千载难逢的语音合成中话语间波动评估
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
高道 慎之介;郡山 知樹;齋藤 佑樹;猿渡 洋 - 通讯作者:
猿渡 洋
高道 慎之介的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('高道 慎之介', 18)}}的其他基金
音声音響ダークデータ採掘技術の研究
音频声学暗数据挖掘技术研究
- 批准号:
23K24895 - 财政年份:2024
- 资助金额:
$ 1.02万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Singing voice synthesis that can form ensemble with humans and computers
人机合奏的歌声合成
- 批准号:
23K18474 - 财政年份:2023
- 资助金额:
$ 1.02万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
Research on retriving speech and acoustic dark data
语音和声学暗数据检索研究
- 批准号:
22H03639 - 财政年份:2022
- 资助金额:
$ 1.02万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
相似海外基金
同時通訳における非コード置換処理の記述:技術的側面と基盤的側面
同声传译中非代码替换处理的描述:技术和基础方面
- 批准号:
24K04046 - 财政年份:2024
- 资助金额:
$ 1.02万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
省略と言い換えによる訳出時間の短縮機能を備えた同時通訳機の研究
具有缩略释义功能缩短翻译时间的同声传译机的研究
- 批准号:
24KJ1695 - 财政年份:2024
- 资助金额:
$ 1.02万 - 项目类别:
Grant-in-Aid for JSPS Fellows
同時通訳の訳出方略の分析のための柔軟な対訳対応付け手法の開発
开发灵活的双语映射方法来分析同声传译翻译策略
- 批准号:
17K02765 - 财政年份:2017
- 资助金额:
$ 1.02万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
同時通訳者の訳出プロセスの解明を目指した大規模音声対訳コーパスの定量的分析
大规模音频双语语料库的定量分析,旨在阐明同声传译员的翻译过程
- 批准号:
17652040 - 财政年份:2005
- 资助金额:
$ 1.02万 - 项目类别:
Grant-in-Aid for Exploratory Research
英語講演の同時通訳システムの実現に関する研究
英语讲座同声传译系统的实现研究
- 批准号:
13780278 - 财政年份:2001
- 资助金额:
$ 1.02万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
同時通訳システムの実現を目指した日英話し言葉翻訳に関する研究
以实现同声传译系统为目标的日英口语翻译研究
- 批准号:
11780261 - 财政年份:1999
- 资助金额:
$ 1.02万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
高度翻訳機と同時通訳装置の実験音声学的基礎研究
先进翻译机和同声传译设备的实验语音基础研究
- 批准号:
X45090-----81077 - 财政年份:1970
- 资助金额:
$ 1.02万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)