权益分类	功能权益	普通用户	{{item.name}}会员
{{category.name}}	{{benefitItem.name}}

認知モデルと常識ベースに基づく情動を含む音声コミュニケーション

语音通信，包括基于认知模型和常识的情感

基本信息

批准号：
08F08049
负责人：
広瀬啓吉
金额：
$ 1.02万
依托单位：
The University of Tokyo
依托单位国家：
日本
项目类别：
Grant-in-Aid for JSPS Fellows
财政年份：
2008
资助国家：
日本
起止时间：
2008 至 2009
项目状态：
已结题

项目摘要

昨年度、文の情動の程度を数値として表し、そこに含まれる感情の指標を抽出することを進めた。本年度は、その手法を高度化するとともに、得られる指標を合成音声に反映させることを中心に研究を進め、下記成果を達成した。1.ニュース文について、動詞に着目して各句の肯定/否定の程度を評点として数値化した上で、順接、逆節といった句間の関係から、文全体の肯定/否定の程度を評点として与える手法を開発した。評点を用いて、英語音声合成フリーウェアのMARY音声合成システムの韻律を制御することを行った。お祭りのニュースなど、文内容が肯定的な場合は基本周波数/発話速度を上げ、事故のような、否定的な場合は、下げることを基本とする制御を行うことにより、文内容にふさわしい合成音声を得た。2.認知モデルの立場から、喜び、悲しみなどの感情を、肯定/否定、興奮/抑制といった軸によって定式化し、文内容に含まれる感性情報を抽出する手法を開発した。肯定/否定、興奮/抑制の値によりMARY音声合成システムの韻律を制御することを行い、合成音声の聴取実験により抽出した感情が適切に反映されることを確認した。3.音声からそこに含まれる情動/感性を抽出する手法について、音響部分の構築として、スペクトルの周波数と時間方向の変化の特徴と韻律的特徴を用い、Support Vector Machine等による判別を行うことで、定型文に限定されているが、肯定と否定の情動の判別率90%を達成した。4.人間が生活する際に発生する種々の音から、人間の活動を推定する手法(Life Logging)の開発を進めた。音声認識で使われているMFCCを特徴量としたHMMを用いることで良好な音認識が可能なことを示した。

Get annual, wen のの degree を the numerical として table し, そこに containing まれる feelings の index を spare することを into めた. This year は, その gimmick をす empirically るとともに, られる indicator を synthetic voice にさせることを center under をめ, remember に research を reached した. 1. ニュース article について, verbs with mesh しにて each other の yes/no の degree を tip として the numerical change したで, and section, reverse といった sentences between の masato is から, all の yes/no の degree を tip として and える gimmick を open 発した. Tip を with いて, English voice synthesis フリーウェアの MARY voice synthesis システムの rhythm を suppression することを line った. お offering りのニュースなど, text content が sure なは basic cycle count / 発 words speed をげ, accident のような, negative はな occasions, under げることを basic とする suppression を line うことにより, text content にふさわしい synthetic sounds をた. 2. Cognitive モデルの position から, joy び and grief しみなどの feelings を, yes/no, excited/suppression といった shaft によって demean し, text content にまれる emotional intelligence を spare する gimmick を open 発した. Yes/no, excited/inhibition on の numerical により MARY voice synthesis システムの rhythm を suppression することをい, synthetic sounds の聴 take be 験により spare した feelings が appropriate に reflect されることを confirm した. 3. Sounds からそこに containing まれる hearts/perceptual を spare する gimmick について, acoustics part の build として, スペクトルの cycle for と time direction の omens の - 徴と rhythm of 徴をい, Support Vector Machine such as による line discriminant をうことで, finalize the design に qualified されているが, recognizing the と negative のの discriminant rate 90% を reached した. 4. Human が Life する interstate に発 raw する kind 々の sound から presumption, human のをする technique (Life Logging) の open 発を into めた. Sounds to know で that われている MFCC を, 徴 quantity とした HMM を with いることで good がな sound understanding may なことを shown した.

项目成果

期刊论文数量（0）

专著数量（0）

科研奖励数量（0）

会议论文数量（0）

专利数量（0）

Automatic Life-Logging: A novel approach to sense real-world activities by environmental sound cues and common sense

自动生活记录：一种通过环境声音提示和常识来感知现实世界活动的新颖方法

DOI：
10.1109/iccitechn.2008.4803018
发表时间：
2008
期刊：
2008 11th International Conference on Computer and Information Technology
影响因子：
0
作者：
M. Shaikh;M. I. Molla;Keikichi Hirose
通讯作者：
Keikichi Hirose

Assigning suitable phrasal tones and pitch accents by sensing affective information from text to synthesize human-like speech

通过感知文本中的情感信息来分配合适的短语语气和音高重音，以合成类似人类的语音

DOI：
发表时间：
2008
期刊：
Proceedings of Interspeech 1(CD-ROM)
影响因子：
0
作者：
Fagen Li;Masaaki Shirase;Tsuyoshi Takagi;Mostafa Al Masum Shaikh
通讯作者：
Mostafa Al Masum Shaikh

An Approach for Ambient Communication by Detecting Real-world Activities from Environmental Sound Cues

一种通过环境声音提示检测现实世界活动的环境通信方法

DOI：
发表时间：
2008
期刊：
影响因子：
0
作者：
Mostafa Al Masum Shaikh;Helmut Prendinger;Keikichi Hirose;Mitsuru Ishizuka
通讯作者：
Mitsuru Ishizuka

Emotional Speech Synthesis by Sensing Affective Information from Text

通过从文本中感知情感信息来合成情感语音

DOI：
发表时间：
2009
期刊：
影响因子：
0
作者：
Mostafa Al Masum Shaikh;Antonio Rui Ferreira Rebordao;Keikichi Hirose;Mitsuru Ishizuka
通讯作者：
Mitsuru Ishizuka

Easy Living in the Virtual World : A Noble Approach to Integrate Real World Activities to Virtual Worlds

在虚拟世界中轻松生活：将现实世界活动整合到虚拟世界的崇高方法

DOI：
发表时间：
2010
期刊：
International Journal of Web Intelligence and Agent Systems 1(印刷中)(掲載確定)
影响因子：
0
作者：
Fagen Li;Masaaki Shirase;Tsuyoshi Takagi;Mostafa A1 Masum Shaikh
通讯作者：
Mostafa A1 Masum Shaikh

DOI：
{{ item.doi }}
发表时间：
{{ item.publish_year }}
期刊：
{{ item.journal_name }}
影响因子：
{{ item.factor }}
作者：
{{ item.authors }}
通讯作者：
{{ item.author }}

数据更新时间：{{ journalArticles.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ monograph.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ sciAawards.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ conferencePapers.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ patent.updateTime }}

広瀬啓吉其他文献

生成過程モデルに基づく母語話者と中国語話者の日本語朗読音声の基本周波数パターン

基于生成过程模型的母语者和汉语者日语阅读语音的基本频率模式

DOI：
发表时间：
2007
期刊：
影响因子：
0
作者：
平野宏子;広瀬啓吉;河合剛;顧文涛;峯松信明
通讯作者：
峯松信明

音調核モデルに基づく中国語F_0パターンの2段階生成

基于声调核模型的汉语F_0模式的两步生成

DOI：
发表时间：
2006
期刊：
電子情報通信学会技術研究報告(音声研究会) SP2005-159
影响因子：
0
作者：
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬啓吉;浅野泰史;河村美由紀;孫慶華
通讯作者：
孫慶華

基本周波数パターン生成過程モデルのコーパスベースパラメータ自動抽出の評価

基于语料库的基频模式生成过程模型自动参数提取评价

DOI：
发表时间：
2006
期刊：
日本音響学会講演論文集 CD-ROM
影响因子：
0
作者：
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬啓吉;浅野泰史;河村美由紀
通讯作者：
河村美由紀

種々の調子の音声合成のための韻律制御-感情音声合成の視点から-(招待講演)

各种声调语音合成的韵律控制——从情感语音合成的角度——（特邀报告）

DOI：
发表时间：
2006
期刊：
日本音響学会講演論文集 CD-ROM
影响因子：
0
作者：
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬啓吉
通讯作者：
広瀬啓吉

文節単位での感情の程度を考慮した統計的韻律制御

考虑每个短语的情感程度的统计韵律控制

DOI：
发表时间：
2006
期刊：
日本音響学会講演論文集 CD-ROM
影响因子：
0
作者：
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬啓吉;浅野泰史
通讯作者：
浅野泰史