聴覚特性を考慮した音声信号の高品質補間に関する研究

考虑听觉特性的音频信号高质量插值研究

基本信息

项目摘要

1.補間方法の評価・検証音声補間の応用の一つである音声モーフィングは、通常、異なる話者間の補間を行うが、話者間の音声特徴量の違いが大きいため、劣化も大きい上、劣化の原因も特定しづらい。そこで、本研究では、異なる話者間に比べて難易度の低い、同一話者・同一発声におけるモーフィングについて検討し、問題点を明らかにしてきた。特に、同じ発声内容でもスペクトルや基本周波数の変化に富む感情音声並びに、テンポや音程が保たれているため話声よりも扱いの容易な歌唱音声の補間・モーフィングについて検討している。今年度は、より広範なデータを用いての補間方法の検討・評価を行った。特徴点の設定方法を検討する中で、我々は声道断面積関数を利用したスペクトルの補間方法に関する手法を開発した。更なる高品質化のためには、より詳細な検討が必要であるが、極めて柔軟な補間が可能な手法となり得ることが確認されている。2.音声補間を利用したシステムの構築デモシステムの構築及び評価を行った。感情モーフィングを利用した中間的な感情を生成するシステム、入力歌唱音声のテンポを変更して合成するシステム、入力した音声のスペクトル及び基本周波数を実時間で変換して高品質な合成を行う実時間声質変換システムなどを構築した。特に、実時間声質変換システムについては、主観評価実験等による評価を行った結果を論文として投稿し、採録が決定している。このシステムに用いられている分析合成部分では、高品質音声分析合成方式であるSTRAIGHTをベースとしたものを用いているが、高速化や様々な工夫の導入により、実時間処理が難しいと言われていたSTRAIGHTの実時間処理を可能としている。この分析合成部分の評価を行った所、元のSTRAIGHTに比べれば劣化するものの、既存の分析合成であるケプストラムボコーダに比べて主観評価値のMOSにおいて1程度の品質向上が見られている。
1. The filling method between の review between 価 · 検 card sounds fill の 応 with a つ の で あ る sounds モ ー フ ィ ン グ は, usually, different な る の between the speaker's words fill line between を う が, の between the sounds of the speaker's words 徴 quantity の violations い が big き い た め, large degradation も き い on, cause of degradation is の も specific し づ ら い. そ こ で, this study で は, different な る に between the speaker's words than べ て difficulty level low の い, sound the same, the speaker's words the same 発 に お け る モ ー フ ィ ン グ に つ い て beg し 検, problem point を Ming ら か に し て き た. Sound に, with じ 発 content で も ス ペ ク ト ル や basic cycle for の - に む rich emotional sounds and び に, テ ン ポ や interval が bartender た れ て い る た め words sound よ り も Cha い の easy な singing voice between の fill · モ ー フ ィ ン グ に つ い て beg し 検 て い る. This year, タを and よ <s:1> are widely used to discuss and evaluate the 価を industry った with なデ タを タを タを and <s:1> the method of filling the gap <s:1> 検. Beg す の 徴 point setting method is を 検 る で, I 々 は track broken area masato を using し た ス ペ ク ト ル の filling method between に masato す る gimmick を open 発 し た. More な る high-quality の た め に は, よ り detailed な beg が 検 necessary で あ る が, extremely め て が may な technique between soft な fill と な り must る こ と が confirm さ れ て い る. 2. Tween: を, using たシステム, たシステム, デモシステム, び, evaluation, 価を, った. Feelings モ ー フ ィ ン グ を using し た な feelings among を generated す る シ ス テ ム, singing sounds into force の テ ン ポ を - more し て synthetic す る シ ス テ ム, into the force し た sounds の ス ペ ク ト ル and び basic cycle for を で be time variations in し て な high quality synthetic line を う be time sound quality variations in シ ス テ ム な ど を build し た. に, be time, sound quality, and the variations in シ ス テ ム に つ い て は, Lord 観 価 be 験 etc に よ る review 価 を line っ た results を paper と し contribute て し, transcribing が decided し て い る. こ の シ ス テ ム に with い ら れ て い る analysis synthesis part で は way, high quality voice analysis, synthesis で あ る STRAIGHT を ベ ー ス と し た も の を with い て い る が, quick running や others 々 な time の import に よ り, be time 処 が difficult し い と said わ れ て い た STRAIGHT の be time 処 を may と し て い る. こ の analysis synthesis part の review 価 を line っ た, yuan の by STRAIGHT に than べ れ ば degradation す る も の の, analysis of existing の synthetic で あ る ケ プ ス ト ラ ム ボ コ ー ダ に than べ て main 観 review on 価 numerical の MOS に お い て 1 degree の quality が up see ら れ て い る.

项目成果

期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
歌唱音声の音量変化に伴うスペクトル変形の分析について
歌声音量变化引起的频谱变形分析
音声モーフィングにおける対応点の自動化に関する研究
语音变形对应点自动化研究
感情音声データベースにおける母音特徴に注目したSTRAIGHTによる声質・感情変換について
关于使用 STRAIGHT 进行语音质量和情感转换,重点关注情感语音数据库中的元音特征
母音スペクトル形状における音高・音量依存成分の分析について
元音频谱形状中音高/音量相关分量的分析
Procedure "Senza Vibrato" : A Key Component for Morphing Singing
“Senza Vibrato”程序:变形歌唱的关键组成部分
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

坂野 秀樹其他文献

サイドローブのない窓に基づく二種類の音源情報の表現について
基于无旁瓣窗的两类声源信息表示
『火星』の語史 -- 江戸・明治を中心に
“火星”一词的历史——以江户和明治时代为中心
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    河原 英紀;矢田部 浩平;榊原 健一;北村 達也;坂野 秀樹;森勢 将雅;米田達郎
  • 通讯作者:
    米田達郎
アウトリーチではないバイオ(メディア)アートの勧め
非外展的生物(媒体)艺术推荐
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    河原 英紀;矢田部 浩平;榊原 健一;北村 達也;坂野 秀樹;森勢 将雅;斉藤了文;高田若葉・藤木淳;岩崎秀雄
  • 通讯作者:
    岩崎秀雄
異なった時間軸を持つ複数の歌声の実時間モーフィングについて
关于不同时间轴多个歌声的实时变形
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    河原 英紀;森勢 将雅;坂野 秀樹
  • 通讯作者:
    坂野 秀樹
対数周波数領域における高調波成分抑圧処理に基づく多重音の基本周波数推定手法の評価
基于对数频域谐波分量抑制处理的多音基频估计方法评价
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    高島田 良介;坂野 秀樹;旭 健作
  • 通讯作者:
    旭 健作

坂野 秀樹的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('坂野 秀樹', 18)}}的其他基金

声道形状制御に基づく声質制御性および可視化性の高い音声分析合成手法の開発
基于声道形状控制的高音质可控可视化语音分析合成方法开发
  • 批准号:
    24K15000
  • 财政年份:
    2024
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了