RI: Small: Integrative, Semantic-Aware, Speech-Driven Models for Believable Conversational Agents with Meaningful Behaviors

RI:小型:集成的、语义感知的、语音驱动的模型,用于具有有意义行为的可信会话代理

基本信息

  • 批准号:
    1718944
  • 负责人:
  • 金额:
    $ 49.41万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2017
  • 资助国家:
    美国
  • 起止时间:
    2017-09-01 至 2022-08-31
  • 项目状态:
    已结题

项目摘要

This project will analyze, model and synthesize human behaviors to create a believable Conversational Agent (CA). A CA is a virtual agent that interacts with a user, displaying human-like behaviors not only through speech but also through facial expressions and head movements. Replicating or representing human behavior includes generating gestures that are synchronized with speech, convey appropriate meaning in the message, and respond to the behaviors displayed by the user. An appealing approach to synthesize human-like behaviors is the use of data-driven methods, which have the potential of capturing naturalistic variations of the behaviors. Modeling the dependencies between speech and gestures brings insights about verbal and nonverbal communication, underlying the production and coordination mechanisms used during natural human interactions. CAs can be used in a variety of health care applications, such as helping hearing impaired individuals and teaching social skills to autistic children. Tutoring systems that display human-like behaviors to communicate and acknowledge active listening will engage better with the students, helping them in their learning. The project promises a fertile ground for interdisciplinary training of graduate and undergraduate students. The models will be evaluated with an assistive agent (CA or embodied robot) interacting with UT Dallas students, serving as a platform to reach out students from all majors, especially woman and underrepresented minorities.The project will take an integrative, cross-disciplinary approach to generate believable and meaningful behaviors by exploring the intrinsic relation between speech, head motion, and facial expressions, constrained by important aspects of spoken language. The planned research leverages some of the latest developments in the field of deep learning in an integrative fashion, pulling together acoustic features and semantic language structure, to build models that are able to account for the correlation between various facial and head movements. The speech-driven approach will capture the variability of human behavior in a manner that is not easily possible with rule-based approaches. Dialog acts and emotions will be inferred and used to constrain the speech driven models, capturing the relation between high-level conversational functions and facial gestures. The project will offer novel, principled methods to generate behaviors driven by synthesized speech, opening new application domain when only text is available. The approach will capture the acoustic variability in synthesized speech, while maintaining the temporal dependency between gestures and speech. The project will also explore schemes to modify the behaviors of the user by displaying carefully designed gestures generated with our data-driven framework. By tracking the behaviors of the user, the system will provide appropriate responses, closing the loop in the interaction.
这个项目将分析、建模和合成人类行为,以创建一个可信的对话代理(CA)。CA是与用户交互的虚拟代理,不仅通过语音显示类似人类的行为,还通过面部表情和头部运动显示类似人类的行为。复制或表示人类行为包括生成与语音同步的手势,在消息中传达适当的含义,以及响应用户显示的行为。合成类人行为的一个吸引人的方法是使用数据驱动的方法,这种方法有可能捕捉行为的自然变化。对语言和手势之间的依赖关系进行建模可以深入了解语言和非语言交流,这是自然人类互动过程中使用的产生和协调机制的基础。CA可用于各种医疗保健应用,例如帮助听力受损的个人和向自闭症儿童传授社交技能。显示出与人类相似的行为来交流和承认积极倾听的辅导系统将更好地与学生互动,帮助他们学习。该项目为研究生和本科生的跨学科培训提供了肥沃的土壤。这些模型将通过与德克萨斯大学达拉斯分校的学生互动的辅助代理(CA或虚拟机器人)进行评估,作为接触来自所有专业的学生的平台,特别是女性和代表性较低的少数民族。该项目将采取综合、跨学科的方法,通过探索言语、头部运动和面部表情之间的内在联系,产生可信和有意义的行为,这些行为受到口语重要方面的限制。这项计划中的研究以一种综合的方式利用深度学习领域的一些最新发展,将声学特征和语义语言结构结合在一起,以建立能够解释各种面部和头部动作之间的相关性的模型。语音驱动的方法将以一种基于规则的方法不容易实现的方式来捕捉人类行为的可变性。对话行为和情感将被推断并用于约束语音驱动模型,捕捉高级对话功能和面部手势之间的关系。该项目将提供新颖的、原则性的方法来生成由合成语音驱动的行为,在只有文本可用的情况下打开新的应用领域。该方法将捕捉合成语音中的声学变化,同时保持手势和语音之间的时间相关性。该项目还将探索通过显示由我们的数据驱动框架生成的精心设计的手势来修改用户行为的方案。通过跟踪用户的行为,系统将提供适当的响应,从而关闭交互中的循环。

项目成果

期刊论文数量(19)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
AuxFormer: Robust Approach to Audiovisual Emotion Recognition
Speech-driven Animation with Meaningful Behaviors
  • DOI:
    10.1016/j.specom.2019.04.005
  • 发表时间:
    2017-08
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Najmeh Sadoughi;C. Busso
  • 通讯作者:
    Najmeh Sadoughi;C. Busso
Audiovisual Speech Activity Detection with Advanced Long Short-Term Memory
  • DOI:
    10.21437/interspeech.2018-2490
  • 发表时间:
    2018-09
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Fei Tao;C. Busso
  • 通讯作者:
    Fei Tao;C. Busso
Expressive Speech-Driven Lip Movements with Multitask Learning
End-to-End Audiovisual Speech Recognition System With Multitask Learning
  • DOI:
    10.1109/tmm.2020.2975922
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    7.3
  • 作者:
    Fei Tao;C. Busso
  • 通讯作者:
    Fei Tao;C. Busso
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Carlos Busso其他文献

Enhanced Facial Landmarks Detection for Patients with Repaired Cleft Lip and Palate
增强唇裂和腭裂修复患者的面部标志检测
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Karen Rosero;Ali N. Salman;Berrak Sisman;R. Hallac;Carlos Busso
  • 通讯作者:
    Carlos Busso
SPEECH EMOTION RECOGNITION IN REAL STATIC AND DYNAMIC HUMAN-ROBOT INTERACTION SCENARIOS
真实静态和动态人机交互场景中的语音情感识别
  • DOI:
    10.1016/j.csl.2024.101666
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Nicolás Grágeda;Carlos Busso;Eduardo Alvarado;Ricardo García;R. Mahú;F. Huenupán;N. B. Yoma
  • 通讯作者:
    N. B. Yoma
Mixed Emotion Modelling for Emotional Voice Conversion
用于情感语音转换的混合情感建模
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kun Zhou;Berrak Sisman;Carlos Busso;Haizhou Li
  • 通讯作者:
    Haizhou Li
Richness and Density of Birds in Timber Nothofagus pumilio Forests and their Unproductive Associated Environments
  • DOI:
    10.1007/s10531-004-1665-0
  • 发表时间:
    2005-09-01
  • 期刊:
  • 影响因子:
    3.100
  • 作者:
    María Vanessa Lencinas;Guillermo Martínez Pastur;Marlin Medina;Carlos Busso
  • 通讯作者:
    Carlos Busso
Towards Naturalistic Voice Conversion: NaturalVoices Dataset with an Automatic Processing Pipeline
迈向自然语音转换:具有自动处理管道的 NaturalVoices 数据集
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ali N. Salman;Zongyang Du;Shreeram Suresh Chandra;Ismail Rasim Ulgen;Carlos Busso;Berrak Sisman
  • 通讯作者:
    Berrak Sisman

Carlos Busso的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Carlos Busso', 18)}}的其他基金

CCRI: Medium: MSP-Podcast: Creating The Largest Speech Emotional Database By Leveraging Existing Naturalistic Recordings
CCRI:媒介:MSP-Podcast:利用现有的自然主义录音创建最大的语音情感数据库
  • 批准号:
    2016719
  • 财政年份:
    2020
  • 资助金额:
    $ 49.41万
  • 项目类别:
    Standard Grant
CRI: CI-P: Creating the Largest Speech Emotional Database by Leveraging Existing Naturalistic Recordings
CRI:CI-P:利用现有的自然录音创建最大的语音情感数据库
  • 批准号:
    1823166
  • 财政年份:
    2018
  • 资助金额:
    $ 49.41万
  • 项目类别:
    Standard Grant
FG 2015 Doctoral Consortium: Travel Support for Graduate Students
FG 2015 博士联盟:研究生旅行支持
  • 批准号:
    1540944
  • 财政年份:
    2015
  • 资助金额:
    $ 49.41万
  • 项目类别:
    Standard Grant
CAREER: Advanced Knowledge Extraction of Affective Behaviors During Natural Human Interaction
职业:人类自然互动过程中情感行为的高级知识提取
  • 批准号:
    1453781
  • 财政年份:
    2015
  • 资助金额:
    $ 49.41万
  • 项目类别:
    Continuing Grant
EAGER: Exploring the Use of Synthetic Speech as Reference Model to Detect Salient Emotional Segments in Speech
EAGER:探索使用合成语音作为参考模型来检测语音中的显着情感片段
  • 批准号:
    1329659
  • 财政年份:
    2013
  • 资助金额:
    $ 49.41万
  • 项目类别:
    Standard Grant
WORKSHOP: Doctoral Consortium for the International Conference on Multimodal Interaction (ICMI 2013)
研讨会:多模式交互国际会议博士联盟 (ICMI 2013)
  • 批准号:
    1346655
  • 财政年份:
    2013
  • 资助金额:
    $ 49.41万
  • 项目类别:
    Standard Grant
RI: Small: Collaborative Research: Exploring Audiovisual Emotion Perception using Data-Driven Computational Modeling
RI:小型:协作研究:使用数据驱动的计算模型探索视听情感感知
  • 批准号:
    1217104
  • 财政年份:
    2012
  • 资助金额:
    $ 49.41万
  • 项目类别:
    Continuing Grant
Workshop: Doctoral Consortium at the 14th International Conference on Multimodal Interaction
研讨会:第14届多模态交互国际会议博士联盟
  • 批准号:
    1249319
  • 财政年份:
    2012
  • 资助金额:
    $ 49.41万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

CSR: Small: Leveraging Physical Side-Channels for Good
CSR:小:利用物理侧通道做好事
  • 批准号:
    2312089
  • 财政年份:
    2024
  • 资助金额:
    $ 49.41万
  • 项目类别:
    Standard Grant
NeTS: Small: NSF-DST: Modernizing Underground Mining Operations with Millimeter-Wave Imaging and Networking
NeTS:小型:NSF-DST:利用毫米波成像和网络实现地下采矿作业现代化
  • 批准号:
    2342833
  • 财政年份:
    2024
  • 资助金额:
    $ 49.41万
  • 项目类别:
    Standard Grant
CPS: Small: NSF-DST: Autonomous Operations of Multi-UAV Uncrewed Aerial Systems using Onboard Sensing to Monitor and Track Natural Disaster Events
CPS:小型:NSF-DST:使用机载传感监测和跟踪自然灾害事件的多无人机无人航空系统自主操作
  • 批准号:
    2343062
  • 财政年份:
    2024
  • 资助金额:
    $ 49.41万
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Small: Reservoir Computing with Ion-Channel-Based Memristors
合作研究:FET:小型:基于离子通道忆阻器的储层计算
  • 批准号:
    2403559
  • 财政年份:
    2024
  • 资助金额:
    $ 49.41万
  • 项目类别:
    Standard Grant
オミックス解析を用いたブドウ球菌 small colony variants の包括的特徴づけ
使用组学分析全面表征葡萄球菌小菌落变体
  • 批准号:
    24K13443
  • 财政年份:
    2024
  • 资助金额:
    $ 49.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
AF: Small: Problems in Algorithmic Game Theory for Online Markets
AF:小:在线市场的算法博弈论问题
  • 批准号:
    2332922
  • 财政年份:
    2024
  • 资助金额:
    $ 49.41万
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Small: Algorithmic Self-Assembly with Crisscross Slats
合作研究:FET:小型:十字交叉板条的算法自组装
  • 批准号:
    2329908
  • 财政年份:
    2024
  • 资助金额:
    $ 49.41万
  • 项目类别:
    Standard Grant
NeTS: Small: ML-Driven Online Traffic Analysis at Multi-Terabit Line Rates
NeTS:小型:ML 驱动的多太比特线路速率在线流量分析
  • 批准号:
    2331111
  • 财政年份:
    2024
  • 资助金额:
    $ 49.41万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
  • 批准号:
    2331302
  • 财政年份:
    2024
  • 资助金额:
    $ 49.41万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
  • 批准号:
    2331301
  • 财政年份:
    2024
  • 资助金额:
    $ 49.41万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了