ビスポーク音声デザインの骨格形成と体系化
定制音频设计的骨架形成和系统化
基本信息
- 批准号:21H04900
- 负责人:
- 金额:$ 27.37万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (A)
- 财政年份:2021
- 资助国家:日本
- 起止时间:2021-04-05 至 2025-03-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
2022年度は,2021年度に構築した音声データベースを用いて発話スタイルの音響特徴解析を行う研究や,音声デザインインタフェース開発を目指したGUIの試作,および様々な特徴を有する音声合成技術の研究等多面的な活動に取り組んだ.音声データベース用いたテキスト音声合成を実装することで,Deep learningベースの方法を用いた場合でも,データベースの量・質ともに問題が無いことを確認した.その後,音声デザインを重視した技術の実現を目指し,従来法の改良に取り組んだ.加えて,声優が意図的に変化させた発話スタイルが,音声の基本周波数やフォルマント周波数,および話速に影響を与えていることを確認した.コーパスの読みやすさを評価するため,2名の声優に4,600文のコーパスを朗読させ,全文のリテイク回数を記録し比較することで朗読が困難な文が無いか評価した.評価の結果,共通する文でリテイク数が増加する傾向は認められず,一文を構成するモーラ数とリテイク数が比例する傾向を確認した.音声分析や合成に関する研究では,避難呼びかけの音声の分析や合成,2話者の中間属性を有する音声の合成技術,およびささやき声の生成法などの実現を目指した研究を推進した.加えて,声質変換技術にも取り組み,Deep neural networks (DNN)による声質変換技術について論文を発表した.音声知覚についても,音声に対して知覚するポジティブ感情,および音声のみならず感情も含めた感情知覚に関する研究を推進した.音声デザインGUIについては,研究代表者の代表的な成果である音声分析合成基盤WORLDをGUIとして実装し,音声デザインインタフェース開発に向けた問題点の洗い出しに取り組んだ.現状では高さ(基本周波数)など物理量で近似できるパラメータの制御に絞り,柔軟に操作できることを優先してプロトタイプを実装した.
In fiscal 2022 and fiscal 2021, we will organize multi-faceted activities such as research on acoustic feature analysis, development of acoustic features, GUI trial, and research on acoustic synthesis technology. The sound quality of sound synthesis is determined by the method of Deep learning. After that, we pay attention to the realization of sound and sound technology, and improve the selection of sound and sound technology. Add, voice actor The number of entries in the list is 4,600. The number of entries in the list is 4,600. The result of the evaluation is that the tendency of increasing the number of articles is confirmed. The research on sound analysis and synthesis is aimed at advancing the research on sound analysis and synthesis, and the research on sound synthesis technology and sound generation method. Deep neural networks (DNN) is a new technology for sound quality conversion. The sound of the sound Sound and Sound Analysis and Synthesis Base WORLD GUI is installed, sound and sound analysis and synthesis base WORLD GUI is installed, sound and sound analysis and synthesis base WORLD GUI is installed, sound and sound analysis base WORLD GUI is installed, sound and sound analysis and synthesis base WORLD GUI is installed, sound and sound and sound analysis base WORLD GUI is installed, sound and sound and sound analysis base WORLD GUI is installed, sound and sound analysis base WORLD GUI is installed, sound and sound and sound analysis base WORLD GUI is installed. The status quo is high (basic cycle number), the physical quantity is approximate, the control is flexible, the operation is preferential, and the installation is complete.
项目成果
期刊论文数量(82)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Implementation of Interactive Tools for Investigating Fundamental Frequency Response of Voiced Sounds to Auditory Stimulation,
实施用于研究语音对听觉刺激的基本频率响应的交互式工具,
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:H. Kawahara;T. Matsui;K. Yatabe;K.-I. Sakakibara;M. Tsuzaki;M. Morise;T. Irino
- 通讯作者:T. Irino
The interaction of emotional information from the voice and touch
来自声音和触摸的情感信息的交互
- DOI:10.1250/ast.43.291
- 发表时间:2022
- 期刊:
- 影响因子:0.7
- 作者:Oya Rika;Tanaka Akihiro
- 通讯作者:Tanaka Akihiro
自己教師あり学習と分類器チェーンを用いた非言語的発声に対する感情識別
使用自我监督学习和分类器链进行非语言话语的情感识别
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Chen Sisheng;Chang Ching-Chun;Echizen Isao;鈴木康章,長谷川恭子,李亮,Thufail I. Fadjal,Riyanto Sugeng,Brahmantara,山口欧志,田中覚;辛徳泰,高道慎之介,猿渡洋
- 通讯作者:辛徳泰,高道慎之介,猿渡洋
A practical method for generating whisper voices: Improvements in phantom silhouette method and application to multiple languages
一种实用的耳语生成方法:幻影轮廓法的改进及其在多种语言中的应用
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Huy H. Nguyen;Trung-Nghia Le;Junichi Yamagishi;and Isao Echizen;T. Uchida and M. Morise
- 通讯作者:T. Uchida and M. Morise
声帯音源の群遅延特性に基づく特徴量を用いた励振源による有声音波形生成法の提案と評価
使用基于声带声源群延迟特性的激励源的浊音波形生成方法的提出和评估
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Hayashi;M.J.;Amano;K.;小口純矢,森勢将雅
- 通讯作者:小口純矢,森勢将雅
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
森勢 将雅其他文献
座席のピッチ運動による擬似歩行運動感覚提示に関する研究,
座椅俯仰运动呈现伪步态动觉的研究,
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
大野 涼平;森勢 将雅;北原鉄朗;加藤隼輝,池井 寧,阿部浩二,島袋誠也,広田光一,雨宮智浩, - 通讯作者:
加藤隼輝,池井 寧,阿部浩二,島袋誠也,広田光一,雨宮智浩,
暗騒音と高調波歪みに頑健なインパルス応答測定用信号:Warped-TSP
脉冲响应测量信号对背景噪声和谐波失真具有鲁棒性:Warped-TSP
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
森勢 将雅;入野 俊夫;坂野 秀樹;河原 英紀 - 通讯作者:
河原 英紀
ビブラートの深さと速さの変化を含む歌唱音声における基本周波数の微細変動の影響の調査
研究歌声基频微小波动的影响,包括颤音深度和速度的变化
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
鈴木 千文;坂野 秀樹;旭 健作;森勢 将雅 - 通讯作者:
森勢 将雅
基本周波数系列のケプストラムを用いたビブラートの速さを反映する距離尺度の検討
用基频级数倒谱检验反映颤音速度的距离尺度
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
鈴木 千文;坂野 秀樹;旭 健作;森勢 将雅 - 通讯作者:
森勢 将雅
森勢 将雅的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('森勢 将雅', 18)}}的其他基金
時間周波数表現の非線形変換に基づく音響システムの計測・制御手法の研究
基于时频表示非线性变换的声学系统测控方法研究
- 批准号:
06J02150 - 财政年份:2006
- 资助金额:
$ 27.37万 - 项目类别:
Grant-in-Aid for JSPS Fellows
相似海外基金
Non-contact measurement of demodulated sound and sound source characteristics of parametric array loudspeaker using precision optical interferometry
利用精密光学干涉技术非接触测量参量阵列扬声器的解调声音和声源特性
- 批准号:
21K14114 - 财政年份:2021
- 资助金额:
$ 27.37万 - 项目类别:
Grant-in-Aid for Early-Career Scientists