权益分类	功能权益	普通用户	{{item.name}}会员
{{category.name}}	{{benefitItem.name}}

平均声に基づく多様な声質・発話スタイルが可能な音声インタラクションシステム

基于平均语音的多种语音质量和说话方式的语音交互系统

基本信息

批准号：
13878070
负责人：
小林隆夫
金额：
$ 1.28万
依托单位：
Tokyo Institute of Technology
依托单位国家：
日本
项目类别：
Grant-in-Aid for Exploratory Research
财政年份：
2001
资助国家：
日本
起止时间：
2001 至 2002
项目状态：
已结题

项目摘要

本研究では,「平均声からの音声合成」という新たな枠組みを提案し,多様な話者の声質や発話様式を自動的に生成可能なマルチモーダルヒューマンコンピュータインタラクションを実現するための基礎を開拓することを目的として,研究初年度に引き続き以下の項目について検討を行った。1.複数の話者の平均的な声の特徴を表す音声単位である平均声モデルの学習法として,初年度に提案した共有決定木コンテキストクラリング(STC)および話者適応学習(SAT)の二つの方法を統合し,話者の性別や学習データ量の大小による影響を低減する新たな平均声モデル学習法を提案した。そして,平均声の音声合成とその評価実験および任意話者が発声した少量の音声データを用いて平均声モデルを話者適応した適応モデルからの音声合成とその評価実験により,従来法に比較して提案法による合成音声の品質が向上し,目標話者の大量の学習データに基づく話者依存モデルに近い合成音声が得られることを示した。さらに,平均声の学習法として,声道長正規化に基づく手法を提案し,その有効性の検討を行った。2.多様な発話様式の合成に向けて,「丁寧」,「ぞんざい」,「楽しげ」,「悲嘆」という異なる様式で発声された音声データベースを作成し,HMM音声合成の枠組みによる音声単位のモデル化と合成音声の評価を行った。その結果,それぞれのデータベース中の発話様式を反映した音声が合成可能なこと,各様式に対応するモデルを補間することにより,中間的な様式の音声が合成できることを明らかにした。3.インタラクションシステムのプラットホームとして,本研究担当者が開発に加わっている「擬人化音声対話エージェント基本ソフトウェア」を利用し,平均声モデルを話者適応したモデルから多様な声質での音声出力が可能なシステムの検討を行った。

In this study, we propose a new method for the automatic generation of voice quality and voice transmission patterns for multiple speakers, and explore the basis for the realization of voice quality and voice synthesis. In the initial year of the study, we introduced the following items for discussion. 1. The average voice characteristics of a plurality of speakers are expressed in terms of voice unit, voice unit. In addition, the quality of the synthesized sound is improved by comparing the proposed method with the original method, and the target speaker's learning is improved by comparing the quality of the synthesized sound with the original method, and the target speaker's learning is improved by comparing the original method with the original method. In this paper, the average sound learning method is proposed, and the sound track length normalization is based on the sound track method. 2. The synthesis direction of multi-channel speech patterns,"Ding Ning,"," As a result, the voice of each of the two types of voice is reflected in the voice synthesis possibility, and the voice of each type of voice is reflected in the voice synthesis possibility. 3. The author of this study developed and improved the "anthropomorphic sound response system basic software" to make use of the average sound response system to improve the quality of sound response system.

项目成果

期刊论文数量（23）

专著数量（0）

科研奖励数量（0）

会议论文数量（0）

专利数量（0）

Yamagishi, Junichi: "A context clustering technique for average voice model in HMM-based speech synthesis"Proceeddings of the 7th International Conference on Spoken Language Processing, ICSLP2002. 1. 133-136 (2002)

Yamagishi、Junichi：“基于 HMM 的语音合成中平均语音模型的上下文聚类技术”第七届国际口语处理会议记录，ICSLP2002。

DOI：
发表时间：
期刊：
影响因子：
0
作者：
通讯作者：

田村正統, 益子貴史, 徳田恵一, 小林隆夫: "HMM音声合成におけるMLLRを用いたピッチ・スペクトルの話者適応"電子情報通信学会技術研究報告. SP2001-11. 15-20 (2001)

Masanori Tamura、Takashi Mashiko、Keiichi Tokuda、Takao Kobayashi：“在 HMM 语音合成中使用 MLLR 进行扬声器自适应”IEICE 技术报告 SP2001-11 (2001)。

DOI：
发表时间：
期刊：
影响因子：
0
作者：
通讯作者：

田村, 正統: "HMMに基づく音声合成におけるピッチ・スペクトルの話者適応"電子情報通信学会論文誌. J85-D-II・4. 545-553 (2002)

Tamura, Masashi：“基于 HMM 的语音合成中的音调频谱的扬声器自适应”，电子、信息和通信工程师学会会刊 J85-D-II·4（2002 年）。

DOI：
发表时间：
期刊：
影响因子：
0
作者：
通讯作者：

M.Tamura, T.Masuko, K.Tokuda, T.Kobayashi: "Text-to-speech synthesis with arbitrary speaker's voice from average voice"Proceeding of the 7th European Conference on Speech Communication and Technology, EUROSPEECH 2001. I. 345-348 (2001)

M.Tamura、T.Masuko、K.Tokuda、T.Kobayashi：“从平均语音中任意说话人的语音进行文本到语音合成”第七届欧洲语音通信与技术会议记录，EUROSPEECH 2001。I. 345-

DOI：
发表时间：
期刊：
影响因子：
0
作者：
通讯作者：

大西, 浩二: "HMM音声合成における異なる発話スタイルの生成の検討"電子情報通信学会技術研究報告. 102・619. 17-22 (2003)

Onishi, Koji：“HMM 语音合成中不同语音风格的生成研究”IEICE 技术报告 102・619 (2003)。

DOI：
发表时间：
期刊：
影响因子：
0
作者：
通讯作者：

DOI：
{{ item.doi }}
发表时间：
{{ item.publish_year }}
期刊：
{{ item.journal_name }}
影响因子：
{{ item.factor }}
作者：
{{ item.authors }}
通讯作者：
{{ item.author }}

数据更新时间：{{ journalArticles.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ monograph.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ sciAawards.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ conferencePapers.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ patent.updateTime }}

小林隆夫其他文献

A comparative study of style adaptation algorithms for expressive speech synthesis

表达语音合成风格适应算法的比较研究

DOI：
发表时间：
2005
期刊：
Proc.the 2005 Autumn Meeting of the Acoustical Society of Japan
影响因子：
0
作者：
Makoto Tachibana;Katsumi Ogata;Junichi Yamagishi;Yuji Nakano;Makoto Tachibana;緒方克海;山岸順一;中野雄資;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;磯貝朱里;橘誠;山岸順一;磯貝朱里;橘誠;野村大輔;中野雄資;能勢隆;橘誠;磯貝朱里;小林隆夫;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;Juri Isogai;Makoto Tachibana;Junichi Yamagishi;Juri Isogai;Makoto Tachibana;Daisuke Nomura;Yuji Nakano;Takashi Nose;Makoto Tachibana
通讯作者：
Makoto Tachibana

HMM音声合成における対数正規分布による状態継続長のモデル化の検討

HMM语音合成中使用对数正态分布建模状态持续时间长度的研究

DOI：
发表时间：
2004
期刊：
日本音響学会2004年春季研究発表会講演論文集 I
影响因子：
0
作者：
Makoto Tachibana;Katsumi Ogata;Junichi Yamagishi;Yuji Nakano;Makoto Tachibana;緒方克海;山岸順一;中野雄資;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;磯貝朱里;橘誠;山岸順一;磯貝朱里;橘誠;野村大輔;中野雄資;能勢隆;橘誠;磯貝朱里;小林隆夫;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;Juri Isogai;Makoto Tachibana;Junichi Yamagishi;Juri Isogai;Makoto Tachibana;Daisuke Nomura;Yuji Nakano;Takashi Nose;Makoto Tachibana;Juri Isogai;Takao Kobayashi;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;磯貝朱里;小林隆夫;磯貝朱里;中野雄資;川島啓吾;山岸順一;磯貝朱里;橘誠;野村大輔;Dhany Arifianto;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Junichi Yamagishi;Heiga Zen;Keisuke Miyanaga;宮永圭介;尾関創;山岸順一;全炳河;山岸順一
通讯作者：
山岸順一

HMM音声合成における異なる発話スタイルへの適応の検討

HMM语音合成中对不同语音风格的适应检验

DOI：
发表时间：
2003
期刊：
日本音響学会2004年秋季研究発表会講演文集 I
影响因子：
0
作者：
Makoto Tachibana;Katsumi Ogata;Junichi Yamagishi;Yuji Nakano;Makoto Tachibana;緒方克海;山岸順一;中野雄資;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;磯貝朱里;橘誠;山岸順一;磯貝朱里;橘誠;野村大輔;中野雄資;能勢隆;橘誠;磯貝朱里;小林隆夫;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;Juri Isogai;Makoto Tachibana;Junichi Yamagishi;Juri Isogai;Makoto Tachibana;Daisuke Nomura;Yuji Nakano;Takashi Nose;Makoto Tachibana;Juri Isogai;Takao Kobayashi;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;磯貝朱里;小林隆夫;磯貝朱里;中野雄資;川島啓吾;山岸順一;磯貝朱里;橘誠;野村大輔;Dhany Arifianto;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Junichi Yamagishi;Heiga Zen;Keisuke Miyanaga;宮永圭介;尾関創;山岸順一;全炳河;山岸順一;橘誠;参納大樹;尾関創;山岸順一;橘誠;Dhany Arifianto;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Junichi Yamagishi;Heiga Zen;Keisuke Miyanaga;Hajime Ozeki;Junichi Yamagishi;Heiga Zen;Junichi Yamagishi;Maokoto Tachibana;Daiki Sannou;Hajime Ozeki;Junichi Yamagishi;Makoto Tachibana;Takao Kobayashi;小林隆夫;Junichi Yamagishi;Heiga Zen;Keisuke Miyanaga;Makoto Tachibana;山岸順一;宮永圭介;尾関創;山岸順一;橘誠;Junichi Yamagishi;Junichi Yamagishi;Dhany Arifianto;Junichi Yamagishi;Dhany Arifianto;広畑誠;山岸順一;橘誠;益子貴史;山岸順一;橘誠
通讯作者：
橘誠