認知モデルと常識ベースに基づく情動を含む音声コミュニケーション

语音通信,包括基于认知模型和常识的情感

基本信息

  • 批准号:
    08F08049
  • 负责人:
  • 金额:
    $ 1.02万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2008
  • 资助国家:
    日本
  • 起止时间:
    2008 至 2009
  • 项目状态:
    已结题

项目摘要

昨年度、文の情動の程度を数値として表し、そこに含まれる感情の指標を抽出することを進めた。本年度は、その手法を高度化するとともに、得られる指標を合成音声に反映させることを中心に研究を進め、下記成果を達成した。1.ニュース文について、動詞に着目して各句の肯定/否定の程度を評点として数値化した上で、順接、逆節といった句間の関係から、文全体の肯定/否定の程度を評点として与える手法を開発した。評点を用いて、英語音声合成フリーウェアのMARY音声合成システムの韻律を制御することを行った。お祭りのニュースなど、文内容が肯定的な場合は基本周波数/発話速度を上げ、事故のような、否定的な場合は、下げることを基本とする制御を行うことにより、文内容にふさわしい合成音声を得た。2.認知モデルの立場から、喜び、悲しみなどの感情を、肯定/否定、興奮/抑制といった軸によって定式化し、文内容に含まれる感性情報を抽出する手法を開発した。肯定/否定、興奮/抑制の値によりMARY音声合成システムの韻律を制御することを行い、合成音声の聴取実験により抽出した感情が適切に反映されることを確認した。3.音声からそこに含まれる情動/感性を抽出する手法について、音響部分の構築として、スペクトルの周波数と時間方向の変化の特徴と韻律的特徴を用い、Support Vector Machine等による判別を行うことで、定型文に限定されているが、肯定と否定の情動の判別率90%を達成した。4.人間が生活する際に発生する種々の音から、人間の活動を推定する手法(Life Logging)の開発を進めた。音声認識で使われているMFCCを特徴量としたHMMを用いることで良好な音認識が可能なことを示した。
Get annual, wen の の degree を the numerical と し て table し, そ こ に containing ま れ る feelings の index を spare す る こ と を into め た. This year は, そ の gimmick を す empirically る と と も に, ら れ る indicator を synthetic voice に さ せ る こ と を center under を め, remember に research を reached し た. 1. ニ ュ ー ス article に つ い て, verbs with mesh し に て each other の yes/no の degree を tip と し て the numerical change し た で, and section, reverse と い っ た sentences between の masato is か ら, all の yes/no の degree を tip と し て and え る gimmick を open 発 し た. Tip を with い て, English voice synthesis フ リ ー ウ ェ ア の MARY voice synthesis シ ス テ ム の rhythm を suppression す る こ と を line っ た. お offering り の ニ ュ ー ス な ど, text content が sure な は basic cycle count / 発 words speed を げ, accident の よ う な, negative は な occasions, under げ る こ と を basic と す る suppression を line う こ と に よ り, text content に ふ さ わ し い synthetic sounds を た. 2. Cognitive モ デ ル の position か ら, joy び and grief し み な ど の feelings を, yes/no, excited/suppression と い っ た shaft に よ っ て demean し, text content に ま れ る emotional intelligence を spare す る gimmick を open 発 し た. Yes/no, excited/inhibition on の numerical に よ り MARY voice synthesis シ ス テ ム の rhythm を suppression す る こ と を い, synthetic sounds の 聴 take be 験 に よ り spare し た feelings が appropriate に reflect さ れ る こ と を confirm し た. 3. Sounds か ら そ こ に containing ま れ る hearts/perceptual を spare す る gimmick に つ い て, acoustics part の build と し て, ス ペ ク ト ル の cycle for と time direction の omens の - 徴 と rhythm of 徴 を い, Support Vector Machine such as に よ る line discriminant を う こ と で, finalize the design に qualified さ れ て い る が, recognizing the と negative の の discriminant rate 90% を reached し た. 4. Human が Life す る interstate に 発 raw す る kind 々 の sound か ら presumption, human の を す る technique (Life Logging) の open 発 を into め た. Sounds to know で that わ れ て い る MFCC を, 徴 quantity と し た HMM を with い る こ と で good が な sound understanding may な こ と を shown し た.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Automatic Life-Logging: A novel approach to sense real-world activities by environmental sound cues and common sense
自动生活记录:一种通过环境声音提示和常识来感知现实世界活动的新颖方法
Assigning suitable phrasal tones and pitch accents by sensing affective information from text to synthesize human-like speech
通过感知文本中的情感信息来分配合适的短语语气和音高重音,以合成类似人类的语音
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Fagen Li;Masaaki Shirase;Tsuyoshi Takagi;Mostafa Al Masum Shaikh
  • 通讯作者:
    Mostafa Al Masum Shaikh
An Approach for Ambient Communication by Detecting Real-world Activities from Environmental Sound Cues
一种通过环境声音提示检测现实世界活动的环境通信方法
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Mostafa Al Masum Shaikh;Helmut Prendinger;Keikichi Hirose;Mitsuru Ishizuka
  • 通讯作者:
    Mitsuru Ishizuka
Emotional Speech Synthesis by Sensing Affective Information from Text
通过从文本中感知情感信息来合成情感语音
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Mostafa Al Masum Shaikh;Antonio Rui Ferreira Rebordao;Keikichi Hirose;Mitsuru Ishizuka
  • 通讯作者:
    Mitsuru Ishizuka
Easy Living in the Virtual World : A Noble Approach to Integrate Real World Activities to Virtual Worlds
在虚拟世界中轻松生活:将现实世界活动整合到虚拟世界的崇高方法
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

広瀬 啓吉其他文献

生成過程モデルに基づく母語話者と中国語話者の日本語朗読音声の基本周波数パターン
基于生成过程模型的母语者和汉语者日语阅读语音的基本频率模式
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    平野 宏子;広瀬 啓吉;河合 剛;顧文 涛;峯松 信明
  • 通讯作者:
    峯松 信明
音調核モデルに基づく中国語F_0パターンの2段階生成
基于声调核模型的汉语F_0模式的两步生成
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史;河村 美由紀;孫慶華
  • 通讯作者:
    孫慶華
基本周波数パターン生成過程モデルのコーパスベースパラメータ自動抽出の評価
基于语料库的基频模式生成过程模型自动参数提取评价
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史;河村 美由紀
  • 通讯作者:
    河村 美由紀
種々の調子の音声合成のための韻律制御-感情音声合成の視点から-(招待講演)
各种声调语音合成的韵律控制——从情感语音合成的角度——(特邀报告)
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉
  • 通讯作者:
    広瀬 啓吉
文節単位での感情の程度を考慮した統計的韻律制御
考虑每个短语的情感程度的统计韵律控制
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史
  • 通讯作者:
    浅野 泰史

広瀬 啓吉的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('広瀬 啓吉', 18)}}的其他基金

劣条件下の混合音響信号の分離とその音声認識への利用
恶劣条件下混合声信号的分离及其在语音识别中的应用
  • 批准号:
    06F06099
  • 财政年份:
    2006
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
フィンランド人日本語学習者による日本語語い音調の韻律研究
芬兰日语学习者对日语声调的韵律研究
  • 批准号:
    06F05756
  • 财政年份:
    2005
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
フィンランド人日本語学習者による日本語語い音調の韻律研究
芬兰日语学习者对日语声调的韵律研究
  • 批准号:
    05F05756
  • 财政年份:
    2005
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
文節境界を考慮した統計的言語モデルの高度化と音声認識への利用
推进考虑子句边界及其在语音识别中的使用的统计语言模型
  • 批准号:
    16650034
  • 财政年份:
    2004
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
中国語基本周波数パターンの分析、定式化と合成手法の開発
中国基频模式分析、合成方法的制定和发展
  • 批准号:
    04F04035
  • 财政年份:
    2004
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
高品質音声合成のための韻律制御
高质量语音合成的韵律控制
  • 批准号:
    12132202
  • 财政年份:
    2000
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
韻律に着目した音声言語情報処理の高度化
以韵律为中心的口语信息处理的复杂性
  • 批准号:
    12132101
  • 财政年份:
    2000
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
モーラ遷移確率モデルによる韻律の表現と音声認識への利用に関する研究
基于mora转移概率模型的韵律表达及其在语音识别中的应用研究
  • 批准号:
    11878058
  • 财政年份:
    1999
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
韻律に着目した音声言語情報処理の高度化に関する調査研究
以韵律为中心的口语信息处理进展研究
  • 批准号:
    10898014
  • 财政年份:
    1998
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
モデルの広がりを考慮した頑健な音声認識手法の研究
考虑模型扩散的鲁棒语音识别方法研究
  • 批准号:
    09878065
  • 财政年份:
    1997
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Exploratory Research

相似海外基金

新しい第二言語視覚的単語認知モデルの構築と評価方法の提案
新型二语视觉词识别模型的构建及评价方法的提出
  • 批准号:
    24K04146
  • 财政年份:
    2024
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
安全から安心へ~身体・認知モデルにもとづくシニアカーの適合支援基盤の確立~
从安全到安心——建立基于物理和认知模型的高级汽车适配支撑平台——
  • 批准号:
    23K25253
  • 财政年份:
    2024
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
予測学習を用いた深層学習認知モデルによる錯覚への構成論的アプローチ
使用预测学习的深度学习认知模型构建幻觉方法
  • 批准号:
    23K25163
  • 财政年份:
    2024
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
認知モデルの頑健性検証のための二次分析アプローチ
验证认知模型稳健性的二次分析方法
  • 批准号:
    22KJ1180
  • 财政年份:
    2023
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
文章理解過程を考慮して文章の定量的評価を行う認知モデルの開発
考虑句子理解过程,开发定量评估句子的认知模型
  • 批准号:
    23KJ0684
  • 财政年份:
    2023
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
認知モデルを組み込んだ音韻意識形成支援システムの開発
开发包含认知模型的语音意识支持系统
  • 批准号:
    23KJ1049
  • 财政年份:
    2023
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
身体挙動と脳活動を踏まえた無信号交差点通過時の空間認知モデル構築の試み
尝试基于身体行为和大脑活动构建经过无信号交叉口时的空间认知模型
  • 批准号:
    21K04297
  • 财政年份:
    2021
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
感覚情報統合に基づく時間認知モデルの検証
基于感觉信息集成的时间感知模型验证
  • 批准号:
    21K03133
  • 财政年份:
    2021
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
認知モデリングによる学習課題遂行時の包括的メタ認知モデルの作成
使用认知建模执行学习任务时创建全面的元认知模型
  • 批准号:
    21K13701
  • 财政年份:
    2021
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
日英語の構文ネットワークを基盤とした事態認知モデル
基于日英句法网络的情境识别模型
  • 批准号:
    20K00668
  • 财政年份:
    2020
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了