EAGER: Data Debugging
EAGER:数据调试
基本信息
- 批准号:1349784
- 负责人:
- 金额:$ 15万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2013
- 资助国家:美国
- 起止时间:2013-09-01 至 2016-02-29
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Today, systems rely as heavily on data as on the software that manipulates that data. Unlike software, data cannot be easily tested or analyzed for correctness. Part of the problem is that it is difficult to decide whether data is wrong. Typographical errors can change data items by orders of magnitude. For example, the number 1234 might be entered when the correct value is 12.34. Unfortunately, finding this kind of mistake via manual data auditing is onerous, unscalable, and error-prone. Data errors can be costly: Errors in spreadsheet data have led to million dollar losses, and poor data quality has been estimated to cost the US economy more than $600 billion per year. Data debugging is a new approach for locating likely data errors by leveraging the interaction between data and the programs that operate on it. Since it is impossible to know a priori whether data is incorrect, data debugging aims to do the next best thing: identifying data that has an unusual impact on the computation. Intuitively, data with an inordinate impact on the result of a computation is either very important, or it is wrong. By contrast, wrong data whose presence has no particularly unusual effect on the final result does not matter. By calling attention to data with inordinately high impact, data debugging can provide insights into both the data and the computation and reveal errors. Data debugging is especially well-suited for data-intensive programming environments like databases and spreadsheets that intertwine data and programs. Data debugging can dramatically reduce the risks of human data entry errors or data corruption, increase the reliability of computations over data, and potentially save the US economy millions of dollars.
如今,系统对数据的依赖程度与对数据操作软件的依赖程度一样。 与软件不同,数据不能轻易地测试或分析其正确性。部分问题在于很难确定数据是否错误。 印刷错误可能会使数据项发生数量级的变化。例如,当正确值为 12.34 时,可能会输入数字 1234。不幸的是,通过手动数据审核发现此类错误非常繁重、不可扩展且容易出错。 数据错误可能代价高昂:电子表格数据中的错误已导致数百万美元的损失,据估计,糟糕的数据质量每年给美国经济造成超过 6000 亿美元的损失。数据调试是一种通过利用数据和对其进行操作的程序之间的交互来定位可能的数据错误的新方法。由于不可能先验地知道数据是否不正确,因此数据调试的目的是退而求其次:识别对计算有异常影响的数据。直观上,对计算结果影响过大的数据要么非常重要,要么就是错误的。相比之下,错误数据的存在对最终结果没有特别不寻常的影响并不重要。 通过引起人们对具有极高影响力的数据的关注,数据调试可以提供对数据和计算的洞察并揭示错误。数据调试特别适合数据密集型编程环境,例如将数据和程序交织在一起的数据库和电子表格。 数据调试可以显着降低人为数据输入错误或数据损坏的风险,提高数据计算的可靠性,并可能为美国经济节省数百万美元。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Emery Berger其他文献
Emery Berger的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Emery Berger', 18)}}的其他基金
Collaborative Research:SHF:Medium:Bringing Python Up to Speed
合作研究:SHF:Medium:加快 Python 速度
- 批准号:
1954830 - 财政年份:2020
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
SHF: Small: S3: Statistical and Structural Analysis for Spreadsheets
SHF:小型:S3:电子表格的统计和结构分析
- 批准号:
1617892 - 财政年份:2016
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
TWC: Small: Collaborative: EVADE: Evidence-Assisted Detection and Elimination of Security Vulnerabilities
TWC:小型:协作:EVADE:证据辅助检测和消除安全漏洞
- 批准号:
1525888 - 财政年份:2015
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
XPS: FULL: SDA: Collaborative Research: SCORE: Scalability-Oriented Optimization
XPS:完整:SDA:协作研究:SCORE:面向可扩展性的优化
- 批准号:
1439008 - 财政年份:2014
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
SHF: Large: Collaborative Research: Reliable Performance for Modern Systems
SHF:大型:协作研究:现代系统的可靠性能
- 批准号:
1012195 - 财政年份:2010
- 资助金额:
$ 15万 - 项目类别:
Continuing Grant
SHF: Large:Collaborative Research: PASS: Perpetually Available Software Systems
SHF:大型:协作研究:PASS:永久可用的软件系统
- 批准号:
0910883 - 财政年份:2009
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
Probabilistically Correct Execution: Hardening Applications Against Error and Attack
概率上正确的执行:强化应用程序以防止错误和攻击
- 批准号:
0615211 - 财政年份:2006
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
CAREER: Cooperative System Support for Robust High Performance
职业:协作系统支持强大的高性能
- 批准号:
0347339 - 财政年份:2004
- 资助金额:
$ 15万 - 项目类别:
Continuing Grant
相似国自然基金
Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:合作创新研究团队
Data-driven Recommendation System Construction of an Online Medical Platform Based on the Fusion of Information
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:外国青年学者研究基金项目
Development of a Linear Stochastic Model for Wind Field Reconstruction from Limited Measurement Data
- 批准号:
- 批准年份:2020
- 资助金额:40 万元
- 项目类别:
基于Linked Open Data的Web服务语义互操作关键技术
- 批准号:61373035
- 批准年份:2013
- 资助金额:77.0 万元
- 项目类别:面上项目
Molecular Interaction Reconstruction of Rheumatoid Arthritis Therapies Using Clinical Data
- 批准号:31070748
- 批准年份:2010
- 资助金额:34.0 万元
- 项目类别:面上项目
高维数据的函数型数据(functional data)分析方法
- 批准号:11001084
- 批准年份:2010
- 资助金额:16.0 万元
- 项目类别:青年科学基金项目
染色体复制负调控因子datA在细胞周期中的作用
- 批准号:31060015
- 批准年份:2010
- 资助金额:25.0 万元
- 项目类别:地区科学基金项目
Computational Methods for Analyzing Toponome Data
- 批准号:60601030
- 批准年份:2006
- 资助金额:17.0 万元
- 项目类别:青年科学基金项目
相似海外基金
Dark Data from the White Continent: New Light on Five Decades of Vertebrate Paleontology Collections from the Triassic Fremouw Formation of Antarctica
来自白色大陆的暗数据:对南极洲三叠纪 Fremouw 组的五个十年的脊椎动物古生物学收藏的新认识
- 批准号:
2313242 - 财政年份:2024
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
CAREER: Data-Enabled Neural Multi-Step Predictive Control (DeMuSPc): a Learning-Based Predictive and Adaptive Control Approach for Complex Nonlinear Systems
职业:数据支持的神经多步预测控制(DeMuSPc):一种用于复杂非线性系统的基于学习的预测和自适应控制方法
- 批准号:
2338749 - 财政年份:2024
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
Collaborative Research: Constraining next generation Cascadia earthquake and tsunami hazard scenarios through integration of high-resolution field data and geophysical models
合作研究:通过集成高分辨率现场数据和地球物理模型来限制下一代卡斯卡迪亚地震和海啸灾害情景
- 批准号:
2325311 - 财政年份:2024
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
RII Track-4:@NASA: Wind-induced noise in the prospective seismic data measured in the Venusian surface environment
RII Track-4:@NASA:金星表面环境中测量的预期地震数据中的风致噪声
- 批准号:
2327422 - 财政年份:2024
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
RII Track-4:NSF: Physics-Informed Machine Learning with Organ-on-a-Chip Data for an In-Depth Understanding of Disease Progression and Drug Delivery Dynamics
RII Track-4:NSF:利用器官芯片数据进行物理信息机器学习,深入了解疾病进展和药物输送动力学
- 批准号:
2327473 - 财政年份:2024
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
Collaborative Research: EAGER: IMPRESS-U: Groundwater Resilience Assessment through iNtegrated Data Exploration for Ukraine (GRANDE-U)
合作研究:EAGER:IMPRESS-U:通过乌克兰综合数据探索进行地下水恢复力评估 (GRANDE-U)
- 批准号:
2409395 - 财政年份:2024
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
I-Corps: Translation Potential of a Secure Data Platform Empowering Artificial Intelligence Assisted Digital Pathology
I-Corps:安全数据平台的翻译潜力,赋能人工智能辅助数字病理学
- 批准号:
2409130 - 财政年份:2024
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
EAGER: Integrating Pathological Image and Biomedical Text Data for Clinical Outcome Prediction
EAGER:整合病理图像和生物医学文本数据进行临床结果预测
- 批准号:
2412195 - 财政年份:2024
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
Research Infrastructure: CC* Data Storage: Foundational Campus Research Storage for Digital Transformation
研究基础设施:CC* 数据存储:数字化转型的基础校园研究存储
- 批准号:
2346636 - 财政年份:2024
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
CC* Networking Infrastructure: YinzerNet: A Multi-Site Data and AI Driven Research Network
CC* 网络基础设施:YinzerNet:多站点数据和人工智能驱动的研究网络
- 批准号:
2346707 - 财政年份:2024
- 资助金额:
$ 15万 - 项目类别:
Standard Grant














{{item.name}}会员




