SBIR Phase I: Video-to-speech software application to provide real-time, noninvasive, natural voice restoration for voiceless individuals

SBIR 第一阶段:视频转语音软件应用程序,为失声者提供实时、无创、自然的语音恢复

基本信息

  • 批准号:
    2136629
  • 负责人:
  • 金额:
    $ 25.6万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2022
  • 资助国家:
    美国
  • 起止时间:
    2022-09-01 至 2023-11-30
  • 项目状态:
    已结题

项目摘要

The broader impact of this Small Business Innovation Research (SBIR) Phase I project seeks to enable one million Americans that suffer with the loss of ability to speak through disease of or damage to the larynx or mouth (aphonia). The inability to fluently communicate with other people has severe consequences. Voiceless individuals are three times more likely to suffer a preventable adverse event in medical settings than speaking patients, and this can lead to health problems and even life-threatening situations. Up to 50% of these adverse events could be avoided with adequate communication between patients and clinicians. The proposed solution is a video-to-speech software application that provides voiceless people with real-time communication assistance, especially geared towards medical settings. The technology could help prevent hundreds of thousands of adverse health events each year (costing $6.8 billion annually), with benefits for the voiceless population and the healthcare system in general. The innovation may improve voice restoration by providing real-time translation with no training needed and allowing complex messages to be expressed while looking eye-to-eye (an important part of human communication). Moreover, the technology does not require invasive installations nor complex equipment, is readily accessible, and has maintenance requirements that are marginal.This Small Business Innovation Research (SBIR) Phase I project aims to address the intellectual challenge of overcoming the ambiguity of visemes when trying to automate lip-reading. Visemes (the gestures made when talking) and phonemes (the sounds produced with these gestures) do not share a one-to-one correspondence. This makes accurately predicting the intended speech based on visual information challenging. Previous researchers have failed to reach acceptable accuracy levels in the interpretation of visemes, while other tools only work with a few dozen words that must be structured according to pre-defined, fixed rules that are impractical. The main goal of this effort is to develop a combination of convolutional neural networks and recurrent neural network transducers that is capable of accurately differentiating visemes and permits real-time, reliable voice assistance for voiceless people. Project objectives include: (1) pre-training an algorithm to detect phonemes using publicly available speech video, (2) optimizing the phoneme-trained algorithm against healthcare relevant vocabulary, and (3) alpha-testing of the lip-reading algorithm against real-time speech.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
这项小企业创新研究(SBIR)第一阶段项目的更广泛影响是,寻求使100万因喉部或口腔疾病或损伤(失音症)而丧失说话能力的美国人能够说话。不能流利地与他人交流会带来严重的后果。在医疗环境中,无声者遭受可预防的不良事件的可能性是会说话的患者的三倍,这可能导致健康问题,甚至危及生命的情况。通过患者和临床医生之间的充分沟通,多达50%的不良事件可以避免。提出的解决方案是一个视频转语音软件应用程序,为无声者提供实时通信帮助,特别是针对医疗环境。这项技术每年可以帮助预防成千上万的不良健康事件(每年花费68亿美元),对无声人群和整个医疗系统都有好处。这项创新可能会通过提供无需训练的实时翻译来改善语音恢复,并允许在眼睛对视(人类交流的重要组成部分)的情况下表达复杂的信息。此外,该技术不需要侵入式安装,也不需要复杂的设备,易于获取,并且维护要求很少。这个小企业创新研究(SBIR)第一阶段项目旨在解决在尝试自动化唇读时克服假面模糊的智力挑战。语素(说话时做出的手势)和音素(用这些手势发出的声音)并不是一一对应的。这使得基于视觉信息的准确预测语音变得具有挑战性。先前的研究人员在解释字谜时未能达到可接受的精度水平,而其他工具只能处理几十个必须根据预先定义的固定规则构建的单词,这些规则是不切实际的。这项工作的主要目标是开发一种卷积神经网络和循环神经网络换能器的组合,该换能器能够准确地区分人脸,并为无声者提供实时、可靠的语音辅助。项目目标包括:(1)使用公开的语音视频预训练一种算法来检测音素;(2)针对医疗保健相关词汇优化音素训练算法;(3)针对实时语音对唇读算法进行alpha测试。该奖项反映了美国国家科学基金会的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Yi Han其他文献

Study on cooling process of copper tube after three-roll planetary rolling
三辊行星轧制铜管冷却工艺研究
Long Period Continuous Operation Data Sample Generation Method for Power Grid
电网长时间连续运行数据样本生成方法
A Flash-ADC data acquisition system developed for a drift chamber array and a digital filter algorithm for signal processing
为漂移室阵列开发的Flash-ADC数据采集系统和用于信号处理的数字滤波器算法
  • DOI:
    10.1088/1674-1137/40/11/116102
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    3.6
  • 作者:
    Yi Han;Lu Li-Ming;Zhang Zhao;Cheng Wen-Jing;Ji Wei;Huang Yan;Zhang Yan;Li Hong-Jie;Cui Yin-Ping;Lin Ming;Wang Yi-Jie;Duan Li-Min;Hu Rong-Jiang;Xiao Zhi-Gang
  • 通讯作者:
    Xiao Zhi-Gang
The Relationship between Socioeconomic Status and Happiness, Health, and Education: The Review of Literature
社会经济地位与幸福、健康和教育之间的关系:文献综述
Improved Dota2 lineup recommendation model based on a bidirectional LSTM
基于双向LSTM改进的Dota2阵容推荐模型
  • DOI:
    10.26599/tst.2019.9010065
  • 发表时间:
    2020-05
  • 期刊:
  • 影响因子:
    6.6
  • 作者:
    Lei Zhang;Chenbo Xu;Yihua Gao;Yi Han;Xiaojiang Du;Zhihong Tian
  • 通讯作者:
    Zhihong Tian

Yi Han的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似国自然基金

Baryogenesis, Dark Matter and Nanohertz Gravitational Waves from a Dark Supercooled Phase Transition
  • 批准号:
    24ZR1429700
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
ATLAS实验探测器Phase 2升级
  • 批准号:
    11961141014
  • 批准年份:
    2019
  • 资助金额:
    3350 万元
  • 项目类别:
    国际(地区)合作与交流项目
地幔含水相Phase E的温度压力稳定区域与晶体结构研究
  • 批准号:
    41802035
  • 批准年份:
    2018
  • 资助金额:
    12.0 万元
  • 项目类别:
    青年科学基金项目
基于数字增强干涉的Phase-OTDR高灵敏度定量测量技术研究
  • 批准号:
    61675216
  • 批准年份:
    2016
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于Phase-type分布的多状态系统可靠性模型研究
  • 批准号:
    71501183
  • 批准年份:
    2015
  • 资助金额:
    17.4 万元
  • 项目类别:
    青年科学基金项目
纳米(I-Phase+α-Mg)准共晶的临界半固态形成条件及生长机制
  • 批准号:
    51201142
  • 批准年份:
    2012
  • 资助金额:
    25.0 万元
  • 项目类别:
    青年科学基金项目
连续Phase-Type分布数据拟合方法及其应用研究
  • 批准号:
    11101428
  • 批准年份:
    2011
  • 资助金额:
    23.0 万元
  • 项目类别:
    青年科学基金项目
D-Phase准晶体的电子行为各向异性的研究
  • 批准号:
    19374069
  • 批准年份:
    1993
  • 资助金额:
    6.4 万元
  • 项目类别:
    面上项目

相似海外基金

SBIR Phase I: College Bound Video Game
SBIR 第一阶段:大学电子游戏
  • 批准号:
    2225635
  • 财政年份:
    2023
  • 资助金额:
    $ 25.6万
  • 项目类别:
    Standard Grant
SBIR Phase I: Multi-depth-camera volumetric video recording and streaming
SBIR 第一阶段:多深度相机体积视频录制和流媒体
  • 批准号:
    2111631
  • 财政年份:
    2022
  • 资助金额:
    $ 25.6万
  • 项目类别:
    Standard Grant
SBIR Phase I: Low latency and ultra high quality video streaming platform for highly immersive virtual reality (VR) experiences
SBIR 第一阶段:低延迟和超高质量视频流平台,提供高度沉浸式虚拟现实 (VR) 体验
  • 批准号:
    2151286
  • 财政年份:
    2022
  • 资助金额:
    $ 25.6万
  • 项目类别:
    Standard Grant
SBIR Phase I: Automated processing of images and video for wildlife conservation
SBIR 第一阶段:用于野生动物保护的图像和视频自动处理
  • 批准号:
    2126184
  • 财政年份:
    2022
  • 资助金额:
    $ 25.6万
  • 项目类别:
    Standard Grant
SBIR Phase II: High Resolution Terahertz Video Camera for Medical Imaging
SBIR 第二阶段:用于医学成像的高分辨率太赫兹摄像机
  • 批准号:
    2126136
  • 财政年份:
    2022
  • 资助金额:
    $ 25.6万
  • 项目类别:
    Cooperative Agreement
SBIR Phase I: Wave: End-end Security for virtual reality and video conferencing applications (COVID-19)
SBIR 第一阶段:Wave:虚拟现实和视频会议应用程序的终端安全 (COVID-19)
  • 批准号:
    2036207
  • 财政年份:
    2021
  • 资助金额:
    $ 25.6万
  • 项目类别:
    Standard Grant
SBIR Phase I: An AI-Based Collaborative Video Streaming Platform
SBIR 第一阶段:基于人工智能的协作视频流平台
  • 批准号:
    2112229
  • 财政年份:
    2021
  • 资助金额:
    $ 25.6万
  • 项目类别:
    Standard Grant
SBIR Phase I: High Resolution Terahertz Video Camera for People Screening and Medical Imaging
SBIR 第一阶段:用于人体筛查和医学成像的高分辨率太赫兹摄像机
  • 批准号:
    2013992
  • 财政年份:
    2020
  • 资助金额:
    $ 25.6万
  • 项目类别:
    Standard Grant
SBIR Phase II: Filmmaking for Everyone: Computational Video Editing
SBIR 第二阶段:适合所有人的电影制作:计算视频编辑
  • 批准号:
    1950115
  • 财政年份:
    2020
  • 资助金额:
    $ 25.6万
  • 项目类别:
    Standard Grant
SBIR Phase II: Automatically Generating Domain Specific Structured Ontologies for Video
SBIR 第二阶段:自动生成视频领域特定的结构化本体
  • 批准号:
    1853014
  • 财政年份:
    2019
  • 资助金额:
    $ 25.6万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了