平均声に基づく多様な声質・発話スタイルが可能な音声インタラクションシステム
基于平均语音的多种语音质量和说话方式的语音交互系统
基本信息
- 批准号:13878070
- 负责人:
- 金额:$ 1.28万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Exploratory Research
- 财政年份:2001
- 资助国家:日本
- 起止时间:2001 至 2002
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では,「平均声からの音声合成」という新たな枠組みを提案し,多様な話者の声質や発話様式を自動的に生成可能なマルチモーダルヒューマンコンピュータインタラクションを実現するための基礎を開拓することを目的として,研究初年度に引き続き以下の項目について検討を行った。1.複数の話者の平均的な声の特徴を表す音声単位である平均声モデルの学習法として,初年度に提案した共有決定木コンテキストクラリング(STC)および話者適応学習(SAT)の二つの方法を統合し,話者の性別や学習データ量の大小による影響を低減する新たな平均声モデル学習法を提案した。そして,平均声の音声合成とその評価実験および任意話者が発声した少量の音声データを用いて平均声モデルを話者適応した適応モデルからの音声合成とその評価実験により,従来法に比較して提案法による合成音声の品質が向上し,目標話者の大量の学習データに基づく話者依存モデルに近い合成音声が得られることを示した。さらに,平均声の学習法として,声道長正規化に基づく手法を提案し,その有効性の検討を行った。2.多様な発話様式の合成に向けて,「丁寧」,「ぞんざい」,「楽しげ」,「悲嘆」という異なる様式で発声された音声データベースを作成し,HMM音声合成の枠組みによる音声単位のモデル化と合成音声の評価を行った。その結果,それぞれのデータベース中の発話様式を反映した音声が合成可能なこと,各様式に対応するモデルを補間することにより,中間的な様式の音声が合成できることを明らかにした。3.インタラクションシステムのプラットホームとして,本研究担当者が開発に加わっている「擬人化音声対話エージェント基本ソフトウェア」を利用し,平均声モデルを話者適応したモデルから多様な声質での音声出力が可能なシステムの検討を行った。
In this study, we propose a new method for the automatic generation of voice quality and voice transmission patterns for multiple speakers, and explore the basis for the realization of voice quality and voice synthesis. In the initial year of the study, we introduced the following items for discussion. 1. The average voice characteristics of a plurality of speakers are expressed in terms of voice unit, voice unit. In addition, the quality of the synthesized sound is improved by comparing the proposed method with the original method, and the target speaker's learning is improved by comparing the quality of the synthesized sound with the original method, and the target speaker's learning is improved by comparing the original method with the original method. In this paper, the average sound learning method is proposed, and the sound track length normalization is based on the sound track method. 2. The synthesis direction of multi-channel speech patterns,"Ding Ning,"," As a result, the voice of each of the two types of voice is reflected in the voice synthesis possibility, and the voice of each type of voice is reflected in the voice synthesis possibility. 3. The author of this study developed and improved the "anthropomorphic sound response system basic software" to make use of the average sound response system to improve the quality of sound response system.
项目成果
期刊论文数量(23)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Yamagishi, Junichi: "A context clustering technique for average voice model in HMM-based speech synthesis"Proceeddings of the 7th International Conference on Spoken Language Processing, ICSLP2002. 1. 133-136 (2002)
Yamagishi、Junichi:“基于 HMM 的语音合成中平均语音模型的上下文聚类技术”第七届国际口语处理会议记录,ICSLP2002。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
田村正統, 益子貴史, 徳田恵一, 小林隆夫: "HMM音声合成におけるMLLRを用いたピッチ・スペクトルの話者適応"電子情報通信学会技術研究報告. SP2001-11. 15-20 (2001)
Masanori Tamura、Takashi Mashiko、Keiichi Tokuda、Takao Kobayashi:“在 HMM 语音合成中使用 MLLR 进行扬声器自适应”IEICE 技术报告 SP2001-11 (2001)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
田村, 正統: "HMMに基づく音声合成におけるピッチ・スペクトルの話者適応"電子情報通信学会論文誌. J85-D-II・4. 545-553 (2002)
Tamura, Masashi:“基于 HMM 的语音合成中的音调频谱的扬声器自适应”,电子、信息和通信工程师学会会刊 J85-D-II·4(2002 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
M.Tamura, T.Masuko, K.Tokuda, T.Kobayashi: "Text-to-speech synthesis with arbitrary speaker's voice from average voice"Proceeding of the 7th European Conference on Speech Communication and Technology, EUROSPEECH 2001. I. 345-348 (2001)
M.Tamura、T.Masuko、K.Tokuda、T.Kobayashi:“从平均语音中任意说话人的语音进行文本到语音合成”第七届欧洲语音通信与技术会议记录,EUROSPEECH 2001。I. 345-
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
大西, 浩二: "HMM音声合成における異なる発話スタイルの生成の検討"電子情報通信学会技術研究報告. 102・619. 17-22 (2003)
Onishi, Koji:“HMM 语音合成中不同语音风格的生成研究”IEICE 技术报告 102・619 (2003)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
小林 隆夫其他文献
A comparative study of style adaptation algorithms for expressive speech synthesis
表达语音合成风格适应算法的比较研究
- DOI:
- 发表时间:
2005 - 期刊:
- 影响因子:0
- 作者:
Makoto Tachibana;Katsumi Ogata;Junichi Yamagishi;Yuji Nakano;Makoto Tachibana;緒方克海;山岸順一;中野雄資;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;磯貝 朱里;橘 誠;山岸 順一;磯貝 朱里;橘 誠;野村 大輔;中野 雄資;能勢 隆;橘 誠;磯貝 朱里;小林 隆夫;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;Juri Isogai;Makoto Tachibana;Junichi Yamagishi;Juri Isogai;Makoto Tachibana;Daisuke Nomura;Yuji Nakano;Takashi Nose;Makoto Tachibana - 通讯作者:
Makoto Tachibana
HMM音声合成における対数正規分布による状態継続長のモデル化の検討
HMM语音合成中使用对数正态分布建模状态持续时间长度的研究
- DOI:
- 发表时间:
2004 - 期刊:
- 影响因子:0
- 作者:
Makoto Tachibana;Katsumi Ogata;Junichi Yamagishi;Yuji Nakano;Makoto Tachibana;緒方克海;山岸順一;中野雄資;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;磯貝 朱里;橘 誠;山岸 順一;磯貝 朱里;橘 誠;野村 大輔;中野 雄資;能勢 隆;橘 誠;磯貝 朱里;小林 隆夫;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;Juri Isogai;Makoto Tachibana;Junichi Yamagishi;Juri Isogai;Makoto Tachibana;Daisuke Nomura;Yuji Nakano;Takashi Nose;Makoto Tachibana;Juri Isogai;Takao Kobayashi;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;磯貝朱里;小林隆夫;磯貝朱里;中野雄資;川島啓吾;山岸順一;磯貝朱里;橘 誠;野村大輔;Dhany Arifianto;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Junichi Yamagishi;Heiga Zen;Keisuke Miyanaga;宮永 圭介;尾関 創;山岸 順一;全 炳河;山岸 順一 - 通讯作者:
山岸 順一
HMM音声合成における異なる発話スタイルへの適応の検討
HMM语音合成中对不同语音风格的适应检验
- DOI:
- 发表时间:
2003 - 期刊:
- 影响因子:0
- 作者:
Makoto Tachibana;Katsumi Ogata;Junichi Yamagishi;Yuji Nakano;Makoto Tachibana;緒方克海;山岸順一;中野雄資;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;磯貝 朱里;橘 誠;山岸 順一;磯貝 朱里;橘 誠;野村 大輔;中野 雄資;能勢 隆;橘 誠;磯貝 朱里;小林 隆夫;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;Juri Isogai;Makoto Tachibana;Junichi Yamagishi;Juri Isogai;Makoto Tachibana;Daisuke Nomura;Yuji Nakano;Takashi Nose;Makoto Tachibana;Juri Isogai;Takao Kobayashi;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;磯貝朱里;小林隆夫;磯貝朱里;中野雄資;川島啓吾;山岸順一;磯貝朱里;橘 誠;野村大輔;Dhany Arifianto;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Junichi Yamagishi;Heiga Zen;Keisuke Miyanaga;宮永 圭介;尾関 創;山岸 順一;全 炳河;山岸 順一;橘 誠;参納 大樹;尾関 創;山岸 順一;橘 誠;Dhany Arifianto;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Junichi Yamagishi;Heiga Zen;Keisuke Miyanaga;Hajime Ozeki;Junichi Yamagishi;Heiga Zen;Junichi Yamagishi;Maokoto Tachibana;Daiki Sannou;Hajime Ozeki;Junichi Yamagishi;Makoto Tachibana;Takao Kobayashi;小林隆夫;Junichi Yamagishi;Heiga Zen;Keisuke Miyanaga;Makoto Tachibana;山岸順一;宮永圭介;尾関 創;山岸順一;橘 誠;Junichi Yamagishi;Junichi Yamagishi;Dhany Arifianto;Junichi Yamagishi;Dhany Arifianto;広畑誠;山岸 順一;橘 誠;益子 貴史;山岸 順一;橘 誠 - 通讯作者:
橘 誠
小林 隆夫的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('小林 隆夫', 18)}}的其他基金
インタラクティブバーチャルアクター実現のための概念表現からの動作・音声生成
从概念表示生成运动/声音以实现交互式虚拟演员
- 批准号:
17650046 - 财政年份:2005
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Exploratory Research
インタラクションシステムのためのバイモーダル音声合成
交互系统的双模态语音合成
- 批准号:
11878064 - 财政年份:1999
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Exploratory Research
ウェーブレットケプストラム -新しいスペクトル表現パラメーター
小波倒谱 - 新的谱表示参数
- 批准号:
08875076 - 财政年份:1996
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Exploratory Research
雑音環境下における音声の対数スペクトル推定と耐雑音性音声認識への応用
噪声环境下语音的对数谱估计及其在耐噪语音识别中的应用
- 批准号:
04650277 - 财政年份:1992
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
複素領域の微分方程式の研究
复域微分方程研究
- 批准号:
03640186 - 财政年份:1991
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
マイクロ・コンピュータによる中学校理科における教材や教具のデータ・ベース化
利用微机建立初中科学教材和工具数据库
- 批准号:
63908020 - 财政年份:1988
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (B)
一対の破壊面の三次元数値解析による破壊機構解明法の発展と自動解析装置の開発
开发基于一对断裂面的三维数值分析的断裂机理解析方法及自动分析装置的开发
- 批准号:
62420057 - 财政年份:1987
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for General Scientific Research (A)
複素対数周波数特性近似ディジタルフィルタの研究
逼近复对数频率特性的数字滤波器研究
- 批准号:
62750279 - 财政年份:1987
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
ワーク・シート学習を支援する教材や教具のパッケージ化について
关于支持作业单学习的教材和工具的包装
- 批准号:
60908016 - 财政年份:1985
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (B)
一般化ケプストラムによる合成音声の高品質化の研究
利用广义倒谱提高合成语音质量的研究
- 批准号:
59750242 - 财政年份:1984
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)