SHF: Medium: Interactive Debegging for Big Data Analytics

SHF:中:大数据分析的交互式调试

基本信息

  • 批准号:
    1764077
  • 负责人:
  • 金额:
    $ 90万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-07-01 至 2024-06-30
  • 项目状态:
    已结题

项目摘要

An abundance of data in science, engineering, national security, and health care has led to the emerging field of big data analytics. To process massive quantities of data, developers leverage data-intensive scalable computing (DISC) systems in the cloud, such as Google's MapReduce, Apache Hadoop, and Apache Spark. While DISC systems help to address the scalability challenges of big data analytics, they also introduce an enormous challenge for data scientists in understanding and resolving errors. This project addresses the severe lack of debugging support in DISC systems today, which makes it difficult for data scientists to understand their applications, determine the causes of identified errors, and ensure that such errors are properly repaired. The research provides two kinds of debugging support for big data processing programs in modern DISC systems like Apache Spark: new interactive, real-time debugging primitives for large-scale distributed processing and tool-assisted fault-localization services for big data. Technical approaches include a new data provenance technique for providing fine-grained visibility into large-scale distributed data processing and runtime optimizations for iterative development and debugging workloads. Tool-assisted fault localization services leverage these underlying provenance and optimization techniques to pinpoint and characterize the root causes of errors efficiently. Big data analytics is increasingly important in the 21st century, where daily lives leave behind a detailed digital record and decision-makers of all kinds, from companies to government agencies, would like to base their actions on data. The research contributes to improving productivity and correctness of big data applications, which is crucial for many disciplines that distill terabytes of low-value data into high-value insights.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
科学,工程,国家安全和医疗保健方面的大量数据导致了大数据分析的新兴领域。 为了处理大量数据,开发人员利用云中的数据密集型可扩展计算系统(例如Google的MapReduce,Apache Hadoop和Apache Spark)。尽管光盘系统有助于应对大数据分析的可伸缩性挑战,但它们还为数据科学家在理解和解决错误时引入了巨大的挑战。该项目解决了当今光盘系统中严重缺乏调试支持,这使得数据科学家难以理解其应用,确定识别错误的原因,并确保正确修复此类错误。 该研究为现代光盘系统中的大数据处理程序提供了两种调试支持,例如Apache Spark:新的交互式,实时调试原始图,用于大规模分布式处理和用于大数据的工具辅助的故障 - 平局服务。技术方法包括一种新的数据出处技术,用于为迭代开发和调试工作负载提供大规模的分布式数据处理和运行时优化。工具辅助的故障本地化服务利用这些基本的出处和优化技术来确定和表征错误的根本原因。大数据分析在21世纪越来越重要,在21世纪,从公司到政府机构,日常生活留下了详细的数字记录和各种决策者,希望将其行动基于数据。这项研究有助于提高大数据应用的生产力和正确性,这对于许多学科至关重要,这些学科将低价值数据的Terabytes提炼为高价值见解。该奖项反映了NSF的法定任务,并且通过使用该基金会的知识功能和广泛的影响来评估CRITERIA CRITERIA CRITERIA。

项目成果

期刊论文数量(16)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
An Empirical Study of Common Challenges in Developing Deep Learning Applications
Software Engineering for Data Analytics
数据分析软件工程
  • DOI:
    10.1109/ms.2020.2985775
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    3.3
  • 作者:
    Kim, Miryung
  • 通讯作者:
    Kim, Miryung
Sibylvariant Transformations for Robust Text Classification
用于稳健文本分类的 Sibylvariant 变换
Canvas: Isolated and Adaptive Swapping for Multi-Applications on Remote Memory
  • DOI:
    10.48550/arxiv.2203.09615
  • 发表时间:
    2022-03
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Chenxi Wang;Yifan Qiao;Haoran Ma;Shiafun Liu;Yiying Zhang;Wenguang Chen;R. Netravali;Miryung Kim;Guoqing Harry Xu
  • 通讯作者:
    Chenxi Wang;Yifan Qiao;Haoran Ma;Shiafun Liu;Yiying Zhang;Wenguang Chen;R. Netravali;Miryung Kim;Guoqing Harry Xu
Data Scientists in Software Teams: State of the Art and Challenges
  • DOI:
    10.1109/tse.2017.2754374
  • 发表时间:
    2018-11-01
  • 期刊:
  • 影响因子:
    7.4
  • 作者:
    Kim, Miryung;Zimmermann, Thomas;Begel, Andrew
  • 通讯作者:
    Begel, Andrew
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Miryung Kim其他文献

Chapter 16 Recommending Program Transformations Automating Repetitive Software Changes
第 16 章建议程序转换自动化重复的软件更改
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Miryung Kim;Na Meng
  • 通讯作者:
    Na Meng
Equity and Access in Algorithms, Mechanisms, and Optimization
算法、机制、优化的公平与准入
NaturalFuzz: Natural Input Generation for Big Data Analytics
NaturalFuzz:大数据分析的自然输入生成
C p – C d ≠ ? Eclipse Refactoring APIs P ’ Pure Refactoring Version P ’ ≠
C p – C d ≠ Eclipse 重构 API P ’ 纯重构版本 P ’ ≠ ?
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Everton L. G. Alves;Myoungkyu Song;T. Massoni;Patricia D. L. Machado;Miryung Kim
  • 通讯作者:
    Miryung Kim
SE4ML - Software Engineering for AI-ML-based Systems (Dagstuhl Seminar 20091)
SE4ML - 基于 AI-ML 的系统的软件工程(Dagstuhl 研讨会 20091)
  • DOI:
    10.4230/dagrep.10.2.76
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    K. Kersting;Miryung Kim;Guy Van den Broeck;Thomas Zimmermann
  • 通讯作者:
    Thomas Zimmermann

Miryung Kim的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Miryung Kim', 18)}}的其他基金

Collaborative Research: SHF: Medium: Reinventing Fuzz Testing for Data and Compute Intensive Systems
协作研究:SHF:中:重新发明数据和计算密集型系统的模糊测试
  • 批准号:
    2106404
  • 财政年份:
    2021
  • 资助金额:
    $ 90万
  • 项目类别:
    Standard Grant
CHS: Medium: Collaborative Research: Code demography: Addressing information needs at scale for programming interface users and designers
CHS:媒介:协作研究:代码人口统计:大规模解决编程接口用户和设计者的信息需求
  • 批准号:
    1956322
  • 财政年份:
    2020
  • 资助金额:
    $ 90万
  • 项目类别:
    Standard Grant
I-Corps: Interactive and Automated Debugging for Big Data Analytics
I-Corps:大数据分析的交互式和自动调试
  • 批准号:
    1842657
  • 财政年份:
    2018
  • 资助金额:
    $ 90万
  • 项目类别:
    Standard Grant
SHF: Small: Analytical Support for Investigating Software Modifications in Collaborative Development Environment
SHF:小型:为研究协作开发环境中的软件修改提供分析支持
  • 批准号:
    1533791
  • 财政年份:
    2014
  • 资助金额:
    $ 90万
  • 项目类别:
    Standard Grant
CAREER: Analysis and Automation of Systematic Software Modifications
职业:系统软件修改的分析和自动化
  • 批准号:
    1460325
  • 财政年份:
    2014
  • 资助金额:
    $ 90万
  • 项目类别:
    Continuing Grant
CAREER: Analysis and Automation of Systematic Software Modifications
职业:系统软件修改的分析和自动化
  • 批准号:
    1149391
  • 财政年份:
    2012
  • 资助金额:
    $ 90万
  • 项目类别:
    Continuing Grant
SHF: Small: Analytical Support for Investigating Software Modifications in Collaborative Development Environment
SHF:小型:为研究协作开发环境中的软件修改提供分析支持
  • 批准号:
    1117902
  • 财政年份:
    2011
  • 资助金额:
    $ 90万
  • 项目类别:
    Standard Grant
Information Needs about Software Modification during Collaborative Development Tasks
协同开发任务期间软件修改的信息需求
  • 批准号:
    1043810
  • 财政年份:
    2010
  • 资助金额:
    $ 90万
  • 项目类别:
    Standard Grant

相似国自然基金

复合低维拓扑材料中等离激元增强光学响应的研究
  • 批准号:
    12374288
  • 批准年份:
    2023
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目
基于管理市场和干预分工视角的消失中等企业:特征事实、内在机制和优化路径
  • 批准号:
    72374217
  • 批准年份:
    2023
  • 资助金额:
    41.00 万元
  • 项目类别:
    面上项目
托卡马克偏滤器中等离子体的多尺度算法与数值模拟研究
  • 批准号:
    12371432
  • 批准年份:
    2023
  • 资助金额:
    43.5 万元
  • 项目类别:
    面上项目
中等质量黑洞附近的暗物质分布及其IMRI系统引力波回波探测
  • 批准号:
    12365008
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
中等垂直风切变下非对称型热带气旋快速增强的物理机制研究
  • 批准号:
    42305004
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: SHF: Medium: Responsive Parallelism for Interactive Applications: Theory and Practice
协作研究:SHF:媒介:交互式应用程序的响应式并行性:理论与实践
  • 批准号:
    2107280
  • 财政年份:
    2021
  • 资助金额:
    $ 90万
  • 项目类别:
    Continuing Grant
Collaborative Research: SHF: Medium: Responsive Parallelism for Interactive Applications: Theory and Practice
协作研究:SHF:媒介:交互式应用程序的响应式并行性:理论与实践
  • 批准号:
    2107289
  • 财政年份:
    2021
  • 资助金额:
    $ 90万
  • 项目类别:
    Continuing Grant
Collaborative Research: SHF: Medium: Responsive Parallelism for Interactive Applications: Theory and Practice
协作研究:SHF:媒介:交互式应用程序的响应式并行性:理论与实践
  • 批准号:
    2107241
  • 财政年份:
    2021
  • 资助金额:
    $ 90万
  • 项目类别:
    Continuing Grant
SHF: Medium: Integrating Human and Machine Intelligence for Next Generation Interactive Analog IC Design
SHF:媒介:集成人类和机器智能以实现下一代交互式模拟 IC 设计
  • 批准号:
    1704758
  • 财政年份:
    2017
  • 资助金额:
    $ 90万
  • 项目类别:
    Continuing Grant
SHF: Medium: Fiat: Correct-by-Construction and Mostly Automated Derivation of Programs with an Interactive Theorem Prover
SHF:Medium:Fiat:使用交互式定理证明器进行构造正确和大部分自动推导程序
  • 批准号:
    1512611
  • 财政年份:
    2015
  • 资助金额:
    $ 90万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了