III: Small: Towards Speech-Driven Multimodal Querying

III:小型:迈向语音驱动的多模式查询

基本信息

  • 批准号:
    1816701
  • 负责人:
  • 金额:
    $ 50万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-10-01 至 2022-09-30
  • 项目状态:
    已结题

项目摘要

Modern automatic speech recognition (ASR) tools offer near-human accuracy in many scenarios. This has increased the popularity of speech-driven input in many applications on modern device environments such as tablets and smartphones, while also enabling personal conversational assistants. In this context, this project will study a seemingly simple but important fundamental question: how should one design a speech-driven system to query structured data? Structured data querying is ubiquitous in the enterprise, healthcare, and other domains. Typing queries in the Structured Query Language (SQL) is the gold standard for such querying. But typing SQL is painful or impossible in the above environments, which restricts when and how users can consume their data. SQL also has a learning curve. Existing alternatives such as typed natural language interfaces help improve usability but sacrifice query sophistication substantially. For instance, conversational assistants today support queries mainly over curated vendor-specific datasets, not arbitrary database schemas, and they often fail to understand query intent. This has widened the gap with SQL's high query sophistication and unambiguity. This project will bridge this gap by enabling users to interact with structured data using spoken queries over arbitrary database schemas. It will lead to prototype systems on popular tablet, smartphone, and conversational assistant environments. This could help many data professionals such as data analysts, business reporters, and database administrators, as well as non-technical data enthusiasts. For instance, nurse informaticists can retrieve patient details more easily and unambiguously to assist doctors, while analysts can slice and dice their data even on the move. The research will be disseminated as publications in database and natural language processing conferences. The research and artifacts produced will be integrated into graduate and undergraduate courses on database systems. The PIs will continue supporting students from under-represented groups as part of this project.This project will create three new systems for spoken querying at three levels of "naturalness." The first level targets a tractable and meaningful subset of SQL. This research will exploit three powerful properties of SQL that regular English speech lacks--unambiguous context-free grammar, knowledge of the database schema queried, and knowledge of tokens from the database instance queried--to support arbitrary database schemas and tokens not present in the ASR vocabulary. The PIs will synthesize and innovate upon ideas from information retrieval, natural language processing, and database indexing and combine them with human-in-the-loop query correction to improve accuracy and efficiency. The second version will make SQL querying even more natural and stateful by changing its grammar. This will lead to the first speech-oriented dialect of SQL. The third version will apply the lessons from the previous versions to two state-of-the-art typed natural language interfaces for databases. This will lead to a redesign of such interfaces that exploits both the properties of speech and the database instance queried.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
现代自动语音识别(ASR)工具在许多情况下提供接近人类的准确性。这增加了语音驱动输入在现代设备环境(例如平板电脑和智能手机)上的许多应用中的普及,同时还实现了个人会话助理。在这种情况下,这个项目将研究一个看似简单但重要的基本问题:应该如何设计一个语音驱动的系统来查询结构化数据?结构化数据查询在企业、医疗保健和其他领域中无处不在。使用结构化查询语言(SQL)输入查询是此类查询的黄金标准。但是在上述环境中输入SQL是痛苦的或不可能的,这限制了用户何时以及如何使用他们的数据。SQL也有一个学习曲线。现有的替代方案,如类型化的自然语言接口,有助于提高可用性,但牺牲查询的复杂性大大。例如,今天的会话助理主要支持针对特定于供应商的数据集的查询,而不是任意的数据库模式,并且它们通常无法理解查询意图。这就扩大了与SQL的高查询复杂性和明确性之间的差距。该项目将通过使用户能够使用任意数据库模式上的口头查询与结构化数据进行交互来弥合这一差距。它将导致流行的平板电脑,智能手机和会话助理环境的原型系统。这可以帮助许多数据专业人士,如数据分析师,商业记者和数据库管理员,以及非技术数据爱好者。例如,护士信息学家可以更轻松、更明确地检索患者的详细信息,以帮助医生,而分析师甚至可以在移动中对数据进行切片和切割。该研究将作为数据库和自然语言处理会议的出版物传播。研究和工件生产将被整合到研究生和本科生课程的数据库系统。作为这个项目的一部分,PI将继续支持来自代表性不足群体的学生。这个项目将创建三个新的系统,用于三个“自然”级别的口语查询。“第一级目标是一个易于处理和有意义的SQL子集。这项研究将利用SQL的三个强大的属性,定期英语演讲缺乏-明确的上下文无关语法,查询的数据库模式的知识,并从查询的数据库实例的令牌的知识-支持任意的数据库模式和令牌不存在于ASR词汇。PI将综合和创新信息检索、自然语言处理和数据库索引的思想,并将它们与人工在环查询校正联合收割机相结合,以提高准确性和效率。第二个版本将通过更改语法使SQL查询更加自然和有状态。这将导致第一个面向语音的SQL方言。第三个版本将把以前版本的经验应用到两个最先进的数据库类型化自然语言接口上。这将导致重新设计这样的接口,利用语音和查询的数据库实例的属性。这个奖项反映了NSF的法定使命,并已被认为是值得的支持,通过使用基金会的智力价值和更广泛的影响审查标准进行评估。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Demonstration of SpeakQL: Speech-driven Multimodal Querying of Structured Data
SpeakQL 演示:语音驱动的结构化数据多模态查询
Structured Data Representation in Natural Language Interfaces
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yutong Shao;Arun Kumar;Ndapandula Nakashole
  • 通讯作者:
    Yutong Shao;Arun Kumar;Ndapandula Nakashole
SpeakQL: Towards Speech-driven Multimodal Querying of Structured Data
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Arun Kumar其他文献

Protective Effect of Piper nigrum on Sodium Arsenite Induced Toxicity in Charles Foster Rats
黑胡椒对亚砷酸钠引起的 Charles Foster 大鼠毒性的保护作用
The Ahmedabad Declaration, 2018: the family and diabetes
2018 年艾哈迈达巴德宣言:家庭与糖尿病
Inter-channel variations in P300 amplitudes-an advocacy for multichannel recording
P300 幅度的通道间变化 - 多通道记录的倡导
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    J. Anupriya;R. Prakash;Arun Kumar;M. S. Roopakala
  • 通讯作者:
    M. S. Roopakala
A rat toxicogenomics study with the calcium sensitizer EMD82571 reveals a pleiotropic cause of teratogenicity.
使用钙增敏剂 EMD82571 进行的大鼠毒理基因组学研究揭示了致畸性的多效性原因。
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    3.3
  • 作者:
    P. Hewitt;P. Singh;Arun Kumar;C. Gnewuch;G. Liebisch;G. Schmitz;J. Borlak
  • 通讯作者:
    J. Borlak
Is it important to analyse serum liver enzymes in patients with established metabolic syndrome? A Pilot study to tie the knot
分析患有代谢综合征的患者的血清肝酶是否重要?
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    S. Maiti;Arun Kumar
  • 通讯作者:
    Arun Kumar

Arun Kumar的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Arun Kumar', 18)}}的其他基金

CAREER: Multi-Query Optimizations for Deep Learning Systems
职业:深度学习系统的多查询优化
  • 批准号:
    1942724
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant

相似国自然基金

基于小胶质细胞-神经元通讯的线粒体自噬调控在癫痫中的作用及虎杖苷干预研究
  • 批准号:
    JCZRYB202501348
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
SK4促进EAT巨噬细胞外泌体cfa-miR-22e分泌在房颤犬海马小胶质细胞极化中的作用机制研究
  • 批准号:
    JCZRYB202501409
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于PROTAC技术靶向EFTUD2小分子降解剂设计和结构优化与抗肺癌活性研究
  • 批准号:
    JCZRYB202501469
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于AMPK/mTOR/TFEB通路介导自噬探讨电针对AD小鼠小胶质细胞线粒体功能及认知障碍的作用机制
  • 批准号:
    JCZRLH202500363
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
单细胞测序解析Itgb2促进小胶质细胞活化加剧神经节细胞损伤机制及其在视网膜动脉阻塞中的临床应用
  • 批准号:
    JCZRQN202500827
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
利用纳米离子探针对小尺寸纳米纤维素晶杀伤鳞癌的机制研究
  • 批准号:
    JCZRYB202500324
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
治疗呼吸道合胞病毒(RSV)感染的小分子创新药临床前研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
小胶质细胞通过FABP5/LXR/SREBP1轴介导的吞噬功能障碍加剧阿尔茨海默病Aβ病理的机制研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于多重时序液滴数字CRISPR的肺癌单个小细胞外囊泡miRNAs多靶标灵敏检测新方法研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于小目标检测与DeepSeek大模型的智能医学检测及诊疗研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目

相似海外基金

Collaborative Research: IIS-III: Small Towards Fair Outlier Detection
协作研究:IIS-III:小到公平的异常值检测
  • 批准号:
    2310481
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: A New Machine Learning Paradigm Towards Effective yet Efficient Foundation Graph Learning Models
III:小型:一种新的机器学习范式,实现有效且高效的基础图学习模型
  • 批准号:
    2321504
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: Towards Highly Accurate Map Services
III:小:迈向高精度地图服务
  • 批准号:
    2203553
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: Towards Explainable Personalization
III:小:迈向可解释的个性化
  • 批准号:
    2007492
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
III: Small: Towards the Foundations of Training Deep Neural Networks: New Theory and Algorithms
III:小:迈向训练深度神经网络的基础:新理论和算法
  • 批准号:
    2008981
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
III: Small: Towards Explainable Recommendation Systems
III:小:迈向可解释的推荐系统
  • 批准号:
    1910154
  • 财政年份:
    2019
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: Towards a Theoretical Foundation for Diffusion Source Localization
III:小:迈向扩散源定位的理论基础
  • 批准号:
    2003924
  • 财政年份:
    2019
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: Towards Resolving Ad-hoc Concept Queries with Table Answers via Multi-source Data Mining
III:小:通过多源数据挖掘解决带有表答案的临时概念查询
  • 批准号:
    1815674
  • 财政年份:
    2018
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: Towards a Theoretical Foundation for Diffusion Source Localization
III:小:迈向扩散源定位的理论基础
  • 批准号:
    1715385
  • 财政年份:
    2017
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: Collaborative Research: Towards End-to-End Knowledge Discovery in Complex Brain Networks
III:小:协作研究:复杂大脑网络中的端到端知识发现
  • 批准号:
    1718310
  • 财政年份:
    2017
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了