認知モデルと常識ベースに基づく情動を含む音声コミュニケーション

语音通信,包括基于认知模型和常识的情感

基本信息

  • 批准号:
    08F08049
  • 负责人:
  • 金额:
    $ 1.02万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2008
  • 资助国家:
    日本
  • 起止时间:
    2008 至 2009
  • 项目状态:
    已结题

项目摘要

昨年度、文の情動の程度を数値として表し、そこに含まれる感情の指標を抽出することを進めた。本年度は、その手法を高度化するとともに、得られる指標を合成音声に反映させることを中心に研究を進め、下記成果を達成した。1.ニュース文について、動詞に着目して各句の肯定/否定の程度を評点として数値化した上で、順接、逆節といった句間の関係から、文全体の肯定/否定の程度を評点として与える手法を開発した。評点を用いて、英語音声合成フリーウェアのMARY音声合成システムの韻律を制御することを行った。お祭りのニュースなど、文内容が肯定的な場合は基本周波数/発話速度を上げ、事故のような、否定的な場合は、下げることを基本とする制御を行うことにより、文内容にふさわしい合成音声を得た。2.認知モデルの立場から、喜び、悲しみなどの感情を、肯定/否定、興奮/抑制といった軸によって定式化し、文内容に含まれる感性情報を抽出する手法を開発した。肯定/否定、興奮/抑制の値によりMARY音声合成システムの韻律を制御することを行い、合成音声の聴取実験により抽出した感情が適切に反映されることを確認した。3.音声からそこに含まれる情動/感性を抽出する手法について、音響部分の構築として、スペクトルの周波数と時間方向の変化の特徴と韻律的特徴を用い、Support Vector Machine等による判別を行うことで、定型文に限定されているが、肯定と否定の情動の判別率90%を達成した。4.人間が生活する際に発生する種々の音から、人間の活動を推定する手法(Life Logging)の開発を進めた。音声認識で使われているMFCCを特徴量としたHMMを用いることで良好な音認識が可能なことを示した。
去年,我们提议将情感的程度表达为句子的数值价值,并提取其中所包含的情感指标。今年,我们一直在进行研究,重点是改善该方法并反映合成语音中获得的指标,从而取得了以下结果。 1。在新闻句子中,我们开发了一种方法,将每个短语的肯定/否定程度作为评级,专注于动词,然后基于远期和倒数从句等短语之间的关系,将整个句子作为评级的肯定/否定程度。这些评分用于控制英语语音合成免费软件的玛丽语音综合系统的韵律。通过控制句子的内容为正面的基本频率/说话速度,例如节日新闻,以及在句子的内容为正时降低降低基础的基础,例如事故,可以获得适用于句子内容的综合声音。 2。从认知模型的角度来看,我们开发了一种基于肯定/否定,兴奋/抑制的轴的喜悦和悲伤之类的情绪的方法,并提取文本内容中包含的灵敏度信息。玛丽语音合成系统的韵律受正/消极和兴奋/抑制的价值控制,而合成的语音听力实验证实了提取的情绪得到了适当的反映。 3。关于从声音中提取其中包含的情感/灵敏度的方法,我们使用了90%的正面和负面影响的歧视率,使用频率和频谱特征的特征和韵律特征的特征来构建声学部分,并使用支持向量机进行歧视。 4。我们一直在开发一种从人类生活时发生的各种声音中估算人类活动的方法。已经表明,通过使用HMM可以使用语音识别中使用的MFCC作为功能,可以通过使用HMM来识别良好的声音识别。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Assigning suitable phrasal tones and pitch accents by sensing affective information from text to synthesize human-like speech
通过感知文本中的情感信息来分配合适的短语语气和音高重音,以合成类似人类的语音
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Fagen Li;Masaaki Shirase;Tsuyoshi Takagi;Mostafa Al Masum Shaikh
  • 通讯作者:
    Mostafa Al Masum Shaikh
An Approach for Ambient Communication by Detecting Real-world Activities from Environmental Sound Cues
一种通过环境声音提示检测现实世界活动的环境通信方法
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Mostafa Al Masum Shaikh;Helmut Prendinger;Keikichi Hirose;Mitsuru Ishizuka
  • 通讯作者:
    Mitsuru Ishizuka
Easy Living in the Virtual World : A Noble Approach to Integrate Real World Activities to Virtual Worlds
在虚拟世界中轻松生活:将现实世界活动整合到虚拟世界的崇高方法
Improving TTS Synthesis fbr Emotional Expressivity by a Prosodic Parameterization of Affect based on Linguistic Analysis
基于语言分析的情感韵律参数化提高 TTS 合成的情感表达能力
Emotional Speech Synthesis by Sensing Affective Information from Text
通过从文本中感知情感信息来合成情感语音
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Mostafa Al Masum Shaikh;Antonio Rui Ferreira Rebordao;Keikichi Hirose;Mitsuru Ishizuka
  • 通讯作者:
    Mitsuru Ishizuka
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

広瀬 啓吉其他文献

生成過程モデルに基づく母語話者と中国語話者の日本語朗読音声の基本周波数パターン
基于生成过程模型的母语者和汉语者日语阅读语音的基本频率模式
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    平野 宏子;広瀬 啓吉;河合 剛;顧文 涛;峯松 信明
  • 通讯作者:
    峯松 信明
音調核モデルに基づく中国語F_0パターンの2段階生成
基于声调核模型的汉语F_0模式的两步生成
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史;河村 美由紀;孫慶華
  • 通讯作者:
    孫慶華
基本周波数パターン生成過程モデルのコーパスベースパラメータ自動抽出の評価
基于语料库的基频模式生成过程模型自动参数提取评价
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史;河村 美由紀
  • 通讯作者:
    河村 美由紀
種々の調子の音声合成のための韻律制御-感情音声合成の視点から-(招待講演)
各种声调语音合成的韵律控制——从情感语音合成的角度——(特邀报告)
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉
  • 通讯作者:
    広瀬 啓吉
Corpus-based extraction of F_0 contour generation process model parameters
基于语料库提取F_0轮廓生成过程模型参数
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史;河村 美由紀;孫慶華;Keikichi Hirose;Keikichi Hirose
  • 通讯作者:
    Keikichi Hirose

広瀬 啓吉的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('広瀬 啓吉', 18)}}的其他基金

劣条件下の混合音響信号の分離とその音声認識への利用
恶劣条件下混合声信号的分离及其在语音识别中的应用
  • 批准号:
    06F06099
  • 财政年份:
    2006
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
フィンランド人日本語学習者による日本語語い音調の韻律研究
芬兰日语学习者对日语声调的韵律研究
  • 批准号:
    06F05756
  • 财政年份:
    2005
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
フィンランド人日本語学習者による日本語語い音調の韻律研究
芬兰日语学习者对日语声调的韵律研究
  • 批准号:
    05F05756
  • 财政年份:
    2005
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
文節境界を考慮した統計的言語モデルの高度化と音声認識への利用
推进考虑子句边界及其在语音识别中的使用的统计语言模型
  • 批准号:
    16650034
  • 财政年份:
    2004
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
中国語基本周波数パターンの分析、定式化と合成手法の開発
中国基频模式分析、合成方法的制定和发展
  • 批准号:
    04F04035
  • 财政年份:
    2004
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
高品質音声合成のための韻律制御
高质量语音合成的韵律控制
  • 批准号:
    12132202
  • 财政年份:
    2000
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
韻律に着目した音声言語情報処理の高度化
以韵律为中心的口语信息处理的复杂性
  • 批准号:
    12132101
  • 财政年份:
    2000
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
モーラ遷移確率モデルによる韻律の表現と音声認識への利用に関する研究
基于mora转移概率模型的韵律表达及其在语音识别中的应用研究
  • 批准号:
    11878058
  • 财政年份:
    1999
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
韻律に着目した音声言語情報処理の高度化に関する調査研究
以韵律为中心的口语信息处理进展研究
  • 批准号:
    10898014
  • 财政年份:
    1998
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
モデルの広がりを考慮した頑健な音声認識手法の研究
考虑模型扩散的鲁棒语音识别方法研究
  • 批准号:
    09878065
  • 财政年份:
    1997
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Exploratory Research

相似海外基金

急性期病棟における認知症ケア研修効果の病棟全体への波及推進モデルの開発
开发模型,将急性病房痴呆症护理培训的效果传播到整个病房
  • 批准号:
    24K14196
  • 财政年份:
    2024
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
認知診断モデルを応用したテスト運用が教師の教授学的専門知や評価力に与える影響
应用认知诊断模型的考试管理对教师教学专业知识和评估能力的影响
  • 批准号:
    24H02445
  • 财政年份:
    2024
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Encouragement of Scientists
MCI(軽度認知障害)と診断された人のための包括的支援モデルの開発
为诊断为 MCI(轻度认知障碍)的患者开发综合支持模型
  • 批准号:
    24K00342
  • 财政年份:
    2024
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
嘔吐恐怖の認知行動モデルの精緻化:2つの非機能的認知とマインドフルネスに着目して
呕吐恐惧的认知行为模型的完善:关注两种非功能性认知和正念
  • 批准号:
    24KJ1733
  • 财政年份:
    2024
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
非認知能力を育成する理科学習の環境モデル構築とその学習効果の検証
培养非认知能力的科学学习环境模型构建及学习效果验证
  • 批准号:
    24K06012
  • 财政年份:
    2024
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了