発話動作を起点とした音声生成による代用発声技術の実現
根据语音动作生成语音实现替代语音技术
基本信息
- 批准号:21K11965
- 负责人:
- 金额:$ 2.66万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2021
- 资助国家:日本
- 起止时间:2021-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
情報技術による音声コミュニケーションの拡張のため、その基盤となる調音・音声データベースの拡充と、口唇動画からの音声合成システムの高度化に関する研究をおこなった。調音・音声データベースに関しては、発話時の声道全体の運動を観測し得るリアルタイムMRI(磁気共鳴画像)により、成人女性1名について音素バランス文(ATR503文)の観測実験を実施した。同観測手法により、これまで成人2名のデータ収集を完了しており、今回の測定実験によって当初目標とした3名分のデータ収集が完了する。従って、研究の進捗は当初の予定通りに進んでいる。リアルタイムMRIと同時に音声データの収録を行なっており、今後は撮像時のMRIノイズを除去する音声強調を施して、データセットとして完備する。口唇動画からの音声合成については、これまで収集してきた音声コーパスやベースとなる再帰型のディープニューラルネットワークを使用するとともに、このネットワークモデルの性能向上を目指してGAN(敵対的生成ネットワーク)の適用を検討し、日本音響学会において研究発表をおこなった。同時に、従来から用いてきた再帰的ネットワーク構造と非再帰的構造の比較をおこない、それらの特徴や性能を明らかにした。これらの研究結果は、日本音響学会九州支部の発表会において公表した。本研究の成果は、口唇動画という最小限の調音情報からでも、了解可能な音声を合成できることを示している。特に、調音情報にはピッチや有声・無声のような音源に関連した情報が含まれていないことから、口唇の動きに関する時系列データを手がかりとして、アクセントやイントネーションまでを再現できることは注目に値すると言える。
Information Technology Research on Sound Synthesis and Enhancement of Sound System The tone, sound, sound. The same measurement method was used to complete the collection of 2 adults and 3 adults. In the beginning, the research progress was determined. The audio emphasis is applied to the MRI and sound recording at the same time, and the audio emphasis is removed from the MRI at the time of future imaging. Lip animation sound synthesis in the middle of the discussion, the collection of sound and sound in the middle of the discussion, the Japanese Society of Acoustics in the middle of the research table. At the same time, the characteristics and properties of the new structure and the non-new structure are clearly compared. The results of this study were presented at the Kyushu Branch of the Japan Sound Society. The results of this study include: minimum tuning information of lip animation; understanding of possible sound synthesis; and Special, tone information, sound, silence, sound source, related information, including, but not limited to, mouth movement, time series, reproduction, attention, etc.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
An Investigation of the Effectiveness of Phase for Audio Classification
- DOI:10.1109/icassp43922.2022.9746037
- 发表时间:2021-10
- 期刊:
- 影响因子:0
- 作者:Shunsuke Hidaka;Kohei Wakamiya;T. Kaburagi
- 通讯作者:Shunsuke Hidaka;Kohei Wakamiya;T. Kaburagi
TransformerとGANを用いた口唇動画音声合成
使用 Transformer 和 GAN 合成唇形视频音频
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Shunsuke Hidaka;Yogaku Lee;Moe Nakanishi;Kohei Wakamiya;Takashi Nakagawa;Tokihiko Kaburagi;鏑木時彦;藤田直明,南汰翼,鏑木時彦
- 通讯作者:藤田直明,南汰翼,鏑木時彦
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
鏑木 時彦其他文献
琉球古典音楽(野村流)の歌唱技法による歌声の音響的特徴の分析 -次第上, 次第下, ネーイの場合-
使用琉球古典音乐(野村流)的演唱技巧分析歌声的声学特性 -以志田上、志田下、内伊为例-
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
上江洲 安史;鏑木 時彦 - 通讯作者:
鏑木 時彦
Roman Patronage and Syll(3)656
罗马赞助人和西尔(3)656
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
上江洲 安史;鏑木 時彦;伊藤雅之;伊藤雅之;伊藤雅之;伊藤雅之 - 通讯作者:
伊藤雅之
琉球古典音楽(野村流)の歌唱技法による歌声の音響分析 -うちぐい、當の場合-
使用琉球古典音乐(野村风格)的演唱技巧对歌声进行声学分析 -以内贵和远野为例-
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
上江洲 安史;鏑木 時彦 - 通讯作者:
鏑木 時彦
共和政中期ローマの対外進出と外国使節への贈物
共和国中期罗马的海外扩张与赠送外国使节
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
上江洲 安史;鏑木 時彦;伊藤雅之;伊藤雅之;伊藤雅之;伊藤雅之;伊藤雅之;伊藤雅之 - 通讯作者:
伊藤雅之
ポジテイブ感情のプロトタイプー日本の大学生・大学院生を対象として一
积极情绪的原型:日本大学和研究生的原型。
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
上江洲 安史;鏑木 時彦;伊藤雅之;伊藤雅之;伊藤雅之;伊藤雅之;伊藤雅之;伊藤雅之;伊藤雅之;池田嘉郎 他編;菅原大地・杉江征;昔原大地・武藤世良・杉江征 - 通讯作者:
昔原大地・武藤世良・杉江征
鏑木 時彦的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('鏑木 時彦', 18)}}的其他基金
呼気の高速流体計算を基盤とする音声生成の総括的研究
基于呼气高速流体计算的语音生成综合研究
- 批准号:
24K15010 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
相似海外基金
音声と口唇動画像を併用した英語発音練習システムの開発
使用音频和口型视频开发英语发音练习系统
- 批准号:
12780137 - 财政年份:2000
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)














{{item.name}}会员




