SHF: Medium: Collaborative Research: Computer-Aided Programming for Data Science

SHF:媒介:协作研究:数据科学计算机辅助编程

基本信息

  • 批准号:
    1762299
  • 负责人:
  • 金额:
    $ 105万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-06-01 至 2024-05-31
  • 项目状态:
    已结题

项目摘要

The goal of this project, named DataWizard, is to dramatically simplify the effort that is currently required for data analytics through the use of computer-aided programming. Specifically, this project aims to semi-automate data collection, querying, and wrangling tasks by automatically generating programs from informal specifications. As a result, the DataWizard project will allow domain scientists to focus on more interesting data analytics and visualization tasks, leaving the "grunt work" of data science to computer-aided programming tools. The project will also advance the state-of-the-art in automated program synthesis and natural language processing and apply these techniques to the burgeoning field of big data analytics. From a technical perspective, the goals of the DataWizard project are three-fold. First, this project develops novel programming-by-example and information extraction techniques to address challenges that arise in data collection, including consolidation of different data sources, transformations between hierarchical and relational data, and extraction of information from unstructured data sources. Second, this project explores new techniques for querying data using natural language descriptions. In particular, this project considers data extraction from relational and noSQL databases as well as semi-structured data sources, such as XML and JSON. Third, this project develops novel program synthesis methods for automating data wrangling, cleaning, and imputation tasks that commonly arise in data analytics. Overall, these techniques make it significantly easier for data scientists to gain insights from messy data.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
该项目名为DataWizard,其目标是通过使用计算机辅助编程来大大简化当前数据分析所需的工作。具体来说,这个项目的目标是通过从非正式规范自动生成程序来半自动化数据收集、查询和处理任务。因此,DataWizard项目将允许领域科学家专注于更有趣的数据分析和可视化任务,将数据科学的“繁重工作”留给计算机辅助编程工具。该项目还将推进自动程序合成和自然语言处理的最新技术,并将这些技术应用于新兴的大数据分析领域。从技术角度来看,DataWizard项目的目标有三个方面。首先,该项目开发了新颖的示例编程和信息提取技术,以解决数据收集中出现的挑战,包括整合不同的数据源,分层和关系数据之间的转换,以及从非结构化数据源中提取信息。其次,这个项目探索了使用自然语言描述查询数据的新技术。特别是,该项目考虑从关系和noSQL数据库以及半结构化数据源(如XML和JSON)中提取数据。第三,该项目开发了新的程序合成方法,用于自动化数据分析中常见的数据争吵,清理和估算任务。总的来说,这些技术使数据科学家更容易从杂乱的数据中获得见解。该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Interpretable Entity Representations through Large-Scale Typing
  • DOI:
    10.18653/v1/2020.findings-emnlp.54
  • 发表时间:
    2020-04
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yasumasa Onoe;Greg Durrett
  • 通讯作者:
    Yasumasa Onoe;Greg Durrett
Fine-Grained Entity Typing for Domain Independent Entity Linking
  • DOI:
    10.1609/aaai.v34i05.6380
  • 发表时间:
    2019-09
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yasumasa Onoe;Greg Durrett
  • 通讯作者:
    Yasumasa Onoe;Greg Durrett
Modeling Fine-Grained Entity Types with Box Embeddings
  • DOI:
    10.18653/v1/2021.acl-long.160
  • 发表时间:
    2021-01
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yasumasa Onoe;Michael Boratko;Greg Durrett
  • 通讯作者:
    Yasumasa Onoe;Michael Boratko;Greg Durrett
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Isil Dillig其他文献

Metric Program Synthesis
度量程序综合
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    John Feser;Isil Dillig;Armando Solar-Lezama
  • 通讯作者:
    Armando Solar-Lezama

Isil Dillig的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Isil Dillig', 18)}}的其他基金

FMitF: Track I: Program Synthesis for Robot Learning from Demonstrations
FMITF:轨道 I:机器人从演示中学习的程序综合
  • 批准号:
    2319471
  • 财政年份:
    2023
  • 资助金额:
    $ 105万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Core: Medium: Program Synthesis for Schema Changes
协作研究:SHF:核心:媒介:模式更改的程序综合
  • 批准号:
    2210831
  • 财政年份:
    2022
  • 资助金额:
    $ 105万
  • 项目类别:
    Standard Grant
Expeditions: Collaborative Research: Understanding the World Through Code
探险:合作研究:通过代码了解世界
  • 批准号:
    1918889
  • 财政年份:
    2020
  • 资助金额:
    $ 105万
  • 项目类别:
    Continuing Grant
SHF: Medium: Collaborative Research: Bridging Automated Formal Reasoning and Continuous Optimization for Provably Safe Deep Learning
SHF:中:协作研究:连接自动形式推理和持续优化以实现可证明安全的深度学习
  • 批准号:
    1901376
  • 财政年份:
    2019
  • 资助金额:
    $ 105万
  • 项目类别:
    Standard Grant
SaTC: CORE: Medium: Collaborative: Effective Formal Reasoning for Mobile Malware
SaTC:核心:媒介:协作:移动恶意软件的有效形式推理
  • 批准号:
    1908304
  • 财政年份:
    2019
  • 资助金额:
    $ 105万
  • 项目类别:
    Standard Grant
I-Corps: An Interactive Query Interface
I-Corps:交互式查询界面
  • 批准号:
    1831005
  • 财政年份:
    2018
  • 资助金额:
    $ 105万
  • 项目类别:
    Standard Grant
SHF: Small: Scalable Program Synthesis using Counterexample-Guided Abstraction Refinement
SHF:小型:使用反例引导的抽象细化的可扩展程序综合
  • 批准号:
    1811865
  • 财政年份:
    2018
  • 资助金额:
    $ 105万
  • 项目类别:
    Standard Grant
SHF:Small:Analysis, Repair, and Synthesis for k-Safety
SHF:Small:k-安全的分析、修复和合成
  • 批准号:
    1712067
  • 财政年份:
    2017
  • 资助金额:
    $ 105万
  • 项目类别:
    Standard Grant
CAREER: UNITY: Bridging the Gap Between Program Analyzers and Deductive Verifiers via Abductive Reasoning
职业:UNITY:通过归纳推理弥合程序分析器和演绎验证器之间的差距
  • 批准号:
    1453386
  • 财政年份:
    2015
  • 资助金额:
    $ 105万
  • 项目类别:
    Continuing Grant

相似海外基金

Collaborative Research: SHF: Medium: Differentiable Hardware Synthesis
合作研究:SHF:媒介:可微分硬件合成
  • 批准号:
    2403134
  • 财政年份:
    2024
  • 资助金额:
    $ 105万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Medium: Enabling Graphics Processing Unit Performance Simulation for Large-Scale Workloads with Lightweight Simulation Methods
合作研究:SHF:中:通过轻量级仿真方法实现大规模工作负载的图形处理单元性能仿真
  • 批准号:
    2402804
  • 财政年份:
    2024
  • 资助金额:
    $ 105万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Medium: Tiny Chiplets for Big AI: A Reconfigurable-On-Package System
合作研究:SHF:中:用于大人工智能的微型芯片:可重新配置的封装系统
  • 批准号:
    2403408
  • 财政年份:
    2024
  • 资助金额:
    $ 105万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Medium: Toward Understandability and Interpretability for Neural Language Models of Source Code
合作研究:SHF:媒介:实现源代码神经语言模型的可理解性和可解释性
  • 批准号:
    2423813
  • 财政年份:
    2024
  • 资助金额:
    $ 105万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Medium: Enabling GPU Performance Simulation for Large-Scale Workloads with Lightweight Simulation Methods
合作研究:SHF:中:通过轻量级仿真方法实现大规模工作负载的 GPU 性能仿真
  • 批准号:
    2402806
  • 财政年份:
    2024
  • 资助金额:
    $ 105万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Medium: Differentiable Hardware Synthesis
合作研究:SHF:媒介:可微分硬件合成
  • 批准号:
    2403135
  • 财政年份:
    2024
  • 资助金额:
    $ 105万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Medium: Tiny Chiplets for Big AI: A Reconfigurable-On-Package System
合作研究:SHF:中:用于大人工智能的微型芯片:可重新配置的封装系统
  • 批准号:
    2403409
  • 财政年份:
    2024
  • 资助金额:
    $ 105万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Medium: Enabling GPU Performance Simulation for Large-Scale Workloads with Lightweight Simulation Methods
合作研究:SHF:中:通过轻量级仿真方法实现大规模工作负载的 GPU 性能仿真
  • 批准号:
    2402805
  • 财政年份:
    2024
  • 资助金额:
    $ 105万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Medium: High-Performance, Verified Accelerator Programming
合作研究:SHF:中:高性能、经过验证的加速器编程
  • 批准号:
    2313024
  • 财政年份:
    2023
  • 资助金额:
    $ 105万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Medium: Verifying Deep Neural Networks with Spintronic Probabilistic Computers
合作研究:SHF:中:使用自旋电子概率计算机验证深度神经网络
  • 批准号:
    2311295
  • 财政年份:
    2023
  • 资助金额:
    $ 105万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了