インタラクションシステムのためのバイモーダル音声合成
交互系统的双模态语音合成
基本信息
- 批准号:11878064
- 负责人:
- 金额:$ 1.41万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Exploratory Research
- 财政年份:1999
- 资助国家:日本
- 起止时间:1999 至 2000
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では,任意の文字テキストまたは音声波形が与えられた際,それに対応する音声及び同期のとれた唇の動きを生成する「バイモーダル音声合成」を実現するために,隠れマルコフモデル(HMM)に基づいた新たな枠組みを開拓することを目的として研究を行った。昨年度までの研究により,本研究における基本要素であるHMMの精密なモデル化には,データベースの拡充と画像データの時間分解能の向上が不可欠であることが明らかになったことから,今年度はまず新たな聴覚・視覚音声(音声・唇動画像)データベースの構築を行った。一人の男性話者に対して,日本語音韻バランス文503文章の発話を,従来と同様DATとディジタルビデオにより収録すると同時に,高速度カメラにより250フレーム毎秒で口の動きを撮影し,ラベル付けを行ってデータベースを作成した。次に,HMMに基づいたバイモーダル音声合成手法として,これまでに提案したモデルベースのアプローチに加え,新たに画像ベースのアプローチを提案し検討を行った。モデルベースアプローチでは,唇形状を表すモデルパラメータ抽出の際,抽出誤りが不可避であることから手修正が必要となる。これに対し画像ベースアプローチでは,画像を直接利用するためパラメータ抽出誤りの影響が生じないことに加え,歯や舌など口の内部も同時にモデル化できる利点がある。実際に,テキスト駆動型システムを構成し,自然性の高いバイモーダル合成音声の生成が可能なことを確認した。今後は,本研究で構築した聴覚・視覚音声データベースを研究用として他研究者にも公開し,実用的なバイモーダル音声合成システムの実現をめざす予定である。
In this study, arbitrary text and sound waveforms are generated in parallel with each other, and the purpose of this study is to develop new sound patterns based on HMM. The basic elements of HMM precision transformation are discussed in this paper, and the time decomposition of HMM images can be improved. This year, the construction of HMM images is carried out. A man's male voice is related to Japanese phonology, 503 articles, and the same DAT is recorded at the same time, at a high speed, the voice is recorded at 250 seconds per second, and the voice is recorded at 250 seconds per second. Second,HMM is based on the sound synthesis method, this proposal is proposed to add, new image is proposed to discuss. When extracting, it is necessary to correct the error. The image is directly used to extract the influence of errors, and the internal part of the image is simultaneously used to extract the advantages. In fact, with the construction of a dynamic system, it is confirmed that it is possible to generate highly natural synthetic sound. In the future, this study will construct a set of research methods for visual and audio synthesis, and other researchers will disclose and implement them.
项目成果
期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
酒向慎司,徳田恵一,益子貴史,小林隆夫,北村正: "ピクセルベースアプローチによるHMMに基づいた唇動画像生成"電子情報通信学会2000年総合大会講演論文集 情報・システム. 2. 234 (2000)
Shinji Sakako、Keiichi Tokuda、Takashi Mashiko、Takao Kobayashi、Tadashi Kitamura:“使用基于像素的方法基于 HMM 生成唇部运动图像”IEICE 2000 大会论文集信息和系统。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
S.Sako,K.Tokuda,T.Masuko,T.Kobayashi,T.Kitamura: "HMM-Based text-to-audio-visual speech synthesis"Proc.6th International Conference on Spoken Language Processing, ICSLP 2000. III. 25-28 (2000)
S.Sako,K.Tokuda,T.Masuko,T.Kobayashi,T.Kitamura:“基于 HMM 的文本到视听语音合成”Proc.6th 国际口语处理会议,ICSLP 2000。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
酒向慎司,徳田恵一,北村正,近藤重一,益子貴史,小林隆夫: "唇動画像と音声によるマルチモーダルデータベースの構築"日本音響学会2000年秋季研究発表会講演論文集. I. 223-224 (2001)
Shinji Sakako、Keiichi Tokuda、Tadashi Kitamura、Shigeichi Kondo、Takashi Mashiko、Takao Kobayashi:“使用唇动图像和语音构建多模态数据库”日本声学学会 2000 年秋季研究会议论文集 I. 223-224。 (2001)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
酒向慎司,徳田恵一,益子貴史,小林隆夫,北村正: "HMMに基づいた音声・唇動画像の同時生成-画像ベースアプローチ-"日本音響学会2000年秋季研究発表会講演論文集. I. 235-236 (2000)
Shinji Sakako、Keiichi Tokuda、Takashi Mashiko、Takao Kobayashi、Tadashi Kitamura:“基于 HMM 的语音和嘴唇运动图像的同时生成 - 基于图像的方法 -”日本声学学会 2000 年秋季会议记录 I. 235。 -236 (2000)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
M.Tamura,S.Kondo,T.Masuko,T.Kobayashi: "Text-to-audio-visual speech synthesis based on parameter generation from HMM"Proc.6th European Conference on Speech Communication and Technology. EUROSPEECH-99・2. 959-962 (1999)
M.Tamura、S.Kondo、T.Masuko、T.Kobayashi:“基于 HMM 参数生成的文本到视听语音合成”Proc.6th 欧洲语音通信与技术会议 EUROSPEECH-99・2。 959-962 (1999)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
小林 隆夫其他文献
A comparative study of style adaptation algorithms for expressive speech synthesis
表达语音合成风格适应算法的比较研究
- DOI:
- 发表时间:
2005 - 期刊:
- 影响因子:0
- 作者:
Makoto Tachibana;Katsumi Ogata;Junichi Yamagishi;Yuji Nakano;Makoto Tachibana;緒方克海;山岸順一;中野雄資;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;磯貝 朱里;橘 誠;山岸 順一;磯貝 朱里;橘 誠;野村 大輔;中野 雄資;能勢 隆;橘 誠;磯貝 朱里;小林 隆夫;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;Juri Isogai;Makoto Tachibana;Junichi Yamagishi;Juri Isogai;Makoto Tachibana;Daisuke Nomura;Yuji Nakano;Takashi Nose;Makoto Tachibana - 通讯作者:
Makoto Tachibana
HMM音声合成における対数正規分布による状態継続長のモデル化の検討
HMM语音合成中使用对数正态分布建模状态持续时间长度的研究
- DOI:
- 发表时间:
2004 - 期刊:
- 影响因子:0
- 作者:
Makoto Tachibana;Katsumi Ogata;Junichi Yamagishi;Yuji Nakano;Makoto Tachibana;緒方克海;山岸順一;中野雄資;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;磯貝 朱里;橘 誠;山岸 順一;磯貝 朱里;橘 誠;野村 大輔;中野 雄資;能勢 隆;橘 誠;磯貝 朱里;小林 隆夫;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;Juri Isogai;Makoto Tachibana;Junichi Yamagishi;Juri Isogai;Makoto Tachibana;Daisuke Nomura;Yuji Nakano;Takashi Nose;Makoto Tachibana;Juri Isogai;Takao Kobayashi;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;磯貝朱里;小林隆夫;磯貝朱里;中野雄資;川島啓吾;山岸順一;磯貝朱里;橘 誠;野村大輔;Dhany Arifianto;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Junichi Yamagishi;Heiga Zen;Keisuke Miyanaga;宮永 圭介;尾関 創;山岸 順一;全 炳河;山岸 順一 - 通讯作者:
山岸 順一
HMM音声合成における異なる発話スタイルへの適応の検討
HMM语音合成中对不同语音风格的适应检验
- DOI:
- 发表时间:
2003 - 期刊:
- 影响因子:0
- 作者:
Makoto Tachibana;Katsumi Ogata;Junichi Yamagishi;Yuji Nakano;Makoto Tachibana;緒方克海;山岸順一;中野雄資;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;磯貝 朱里;橘 誠;山岸 順一;磯貝 朱里;橘 誠;野村 大輔;中野 雄資;能勢 隆;橘 誠;磯貝 朱里;小林 隆夫;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;Juri Isogai;Makoto Tachibana;Junichi Yamagishi;Juri Isogai;Makoto Tachibana;Daisuke Nomura;Yuji Nakano;Takashi Nose;Makoto Tachibana;Juri Isogai;Takao Kobayashi;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;磯貝朱里;小林隆夫;磯貝朱里;中野雄資;川島啓吾;山岸順一;磯貝朱里;橘 誠;野村大輔;Dhany Arifianto;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Junichi Yamagishi;Heiga Zen;Keisuke Miyanaga;宮永 圭介;尾関 創;山岸 順一;全 炳河;山岸 順一;橘 誠;参納 大樹;尾関 創;山岸 順一;橘 誠;Dhany Arifianto;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Junichi Yamagishi;Heiga Zen;Keisuke Miyanaga;Hajime Ozeki;Junichi Yamagishi;Heiga Zen;Junichi Yamagishi;Maokoto Tachibana;Daiki Sannou;Hajime Ozeki;Junichi Yamagishi;Makoto Tachibana;Takao Kobayashi;小林隆夫;Junichi Yamagishi;Heiga Zen;Keisuke Miyanaga;Makoto Tachibana;山岸順一;宮永圭介;尾関 創;山岸順一;橘 誠;Junichi Yamagishi;Junichi Yamagishi;Dhany Arifianto;Junichi Yamagishi;Dhany Arifianto;広畑誠;山岸 順一;橘 誠;益子 貴史;山岸 順一;橘 誠 - 通讯作者:
橘 誠
小林 隆夫的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('小林 隆夫', 18)}}的其他基金
インタラクティブバーチャルアクター実現のための概念表現からの動作・音声生成
从概念表示生成运动/声音以实现交互式虚拟演员
- 批准号:
17650046 - 财政年份:2005
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Exploratory Research
平均声に基づく多様な声質・発話スタイルが可能な音声インタラクションシステム
基于平均语音的多种语音质量和说话方式的语音交互系统
- 批准号:
13878070 - 财政年份:2001
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Exploratory Research
ウェーブレットケプストラム -新しいスペクトル表現パラメーター
小波倒谱 - 新的谱表示参数
- 批准号:
08875076 - 财政年份:1996
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Exploratory Research
雑音環境下における音声の対数スペクトル推定と耐雑音性音声認識への応用
噪声环境下语音的对数谱估计及其在耐噪语音识别中的应用
- 批准号:
04650277 - 财政年份:1992
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
複素領域の微分方程式の研究
复域微分方程研究
- 批准号:
03640186 - 财政年份:1991
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
マイクロ・コンピュータによる中学校理科における教材や教具のデータ・ベース化
利用微机建立初中科学教材和工具数据库
- 批准号:
63908020 - 财政年份:1988
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (B)
一対の破壊面の三次元数値解析による破壊機構解明法の発展と自動解析装置の開発
开发基于一对断裂面的三维数值分析的断裂机理解析方法及自动分析装置的开发
- 批准号:
62420057 - 财政年份:1987
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for General Scientific Research (A)
複素対数周波数特性近似ディジタルフィルタの研究
逼近复对数频率特性的数字滤波器研究
- 批准号:
62750279 - 财政年份:1987
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
ワーク・シート学習を支援する教材や教具のパッケージ化について
关于支持作业单学习的教材和工具的包装
- 批准号:
60908016 - 财政年份:1985
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (B)
一般化ケプストラムによる合成音声の高品質化の研究
利用广义倒谱提高合成语音质量的研究
- 批准号:
59750242 - 财政年份:1984
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)