III: Small: Data Analysis in the Cloud with Guaranteed and Explainable Performance
III:小型:云端数据分析,性能有保证且可解释
基本信息
- 批准号:1524535
- 负责人:
- 金额:$ 50万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2015
- 资助国家:美国
- 起止时间:2015-09-01 至 2019-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Increasingly many users have access to large datasets that they need to analyze. Astronomers, oceanographers, and other domain scientists rely on data analysis for their science. Journalists may want to analyze data to use in their articles. Over the past several years, cloud service providers have been offering an increasingly large selection of data management services for data analytics (e.g., Amazon Elastic MapReduce or Google BigQuery). Cloud services provide a seamless access to powerful data analysis tools, often directly through the browser. Too many services, however, remain too close to the traditional mode of operating a database management system. They reveal too much information about their internal architecture and deployment: Users are required to reason at the level of service instances, instance types, and gigabytes processed. As a result, users today must be data management experts to choose between these services and leverage them in a cost-effective manner. This project will develop new data management techniques that will enable cloud service providers to isolate users from the details of their service internals while offering the ability to trade off price and performance. The project will further develop tools to explain performance and help users re-write their queries to improve it.More specifically, the project will develop new approaches to (1) predict not only the query runtime but whether a query is likely to execute slower than estimated due to failures, skew, cardinality estimation errors, or contention; (2) guarantee query runtimes by dynamically changing both the resources allocated to a query and its failure-handling and skew-handling mechanisms as needed; (3) post specific slowdown factors in case of heavy load and guarantee them through novel scheduling algorithms; and (4) explain query performance and suggest rewrites in a way that does not require users to understand query plans. The project will implement all of the algorithms in the open source Myria cloud data management system (and service) recently developed and in continuous operation at the University of Washington.For further information see the project web site at: http://cloudperf.cs.washington.edu
越来越多的用户可以访问他们需要分析的大型数据集。天文学家、海洋学家和其他领域的科学家依靠数据分析来进行科学研究。记者可能希望分析数据以在文章中使用。在过去的几年中,云服务提供商已经为数据分析提供了越来越多的数据管理服务选择(例如,Amazon Elastic MapReduce或Google BigQuery)。云服务提供了对强大的数据分析工具的无缝访问,通常直接通过浏览器。然而,太多的服务仍然太接近于操作数据库管理系统的传统模式。它们揭示了太多关于其内部架构和部署的信息:用户需要在服务实例、实例类型和处理的GB级别进行推理。因此,今天的用户必须是数据管理专家,才能在这些服务之间进行选择,并以具有成本效益的方式利用它们。该项目将开发新的数据管理技术,使云服务提供商能够将用户与其服务内部的细节隔离开来,同时提供权衡价格和性能的能力。该项目将进一步开发工具来解释性能,并帮助用户重写他们的查询,以改善它。更具体地说,该项目将开发新的方法来(1)预测不仅查询运行时,但是否有可能执行慢于估计由于故障,偏斜,基数估计错误,或争用;(2)通过根据需要动态更改分配给查询的资源及其故障处理和偏差处理机制来保证查询运行时间;(3)在重负载情况下发布特定的减速因素,并通过新的调度算法来保证它们;以及(4)以不需要用户理解查询计划的方式解释查询性能并建议重写。 该项目将在最近开发的开源Myria云数据管理系统(和服务)中实现所有算法,并在华盛顿大学持续运行。http://cloudperf.cs.washington.edu
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Magdalena Balazinska其他文献
USENIX Association Proceedings of MobiSys 2003 : The First International Conference on Mobile Systems , Applications , and Services
- DOI:
- 发表时间:
2003 - 期刊:
- 影响因子:0
- 作者:
Magdalena Balazinska - 通讯作者:
Magdalena Balazinska
Literature Survey of Clone Detection Techniques
克隆检测技术文献综述
- DOI:
10.5120/17355-7858 - 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
Sonam Gupta;P. C. Gupta;Brenda S. Baker;Magdalena Balazinska;Ettore Merlo;Michel Dagenais;Bruno Lague;Hamid Basit;Simon Pugliesi;William Smyth;Andrei Turpin;Ira Baxter;A. Yahin;Leonardo Moura;Marcelo Sant;J. Cordy;Thomas Dean - 通讯作者:
Thomas Dean
Finiteness
有限性
- DOI:
- 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
Susan Dumais;Magdalena Balazinska;Jeong;Mehul Shah;Raimondo Schettini;Gianluigi Ciocca;Isabella Gagliardi;Manoranjan Dash;Poon Wei Koot;Benjamin Bustos;Tobias Schreck;Vassilis Plachouras;Michael F. Goodchild;Val Tannen;C. S. Jensen;R. Snodgrass;Aidong Zhang;Bharat Bhargava;Phillip B. Gibbons;Ethan Zhang;Yi Zhang;Soumen Chakrabarti;Alin Deutsch;Jessica Kennedy;A. Cannon;Marcelo Arenas;P. Gray;Ke Deng;D. Woodruff;Jun Huan;Ahmed Metwally;C. Leung;Hong Cheng;Jiawei Han;Antti Ukkonen;Cai;G. Dobbie;Tok Wang Ling;Solmaz Kolahi;Gabriella Pasi;V. Novák - 通讯作者:
V. Novák
Editorial for S.I.: VLDB 2020
- DOI:
10.1007/s00778-022-00734-4 - 发表时间:
2022-03-10 - 期刊:
- 影响因子:3.800
- 作者:
Magdalena Balazinska;Xiaofang Zhou - 通讯作者:
Xiaofang Zhou
Magdalena Balazinska的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Magdalena Balazinska', 18)}}的其他基金
III: Medium: VOCAL: Video Organization and Interactive Compositional AnaLytics
III:媒介:声乐:视频组织和交互式构图分析
- 批准号:
2211133 - 财政年份:2022
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
HDR: I-DIRSE-FW: Accelerating the Engineering Design and Manufacturing Life-Cycle with Data Science
HDR:I-DIRSE-FW:利用数据科学加速工程设计和制造生命周期
- 批准号:
1934292 - 财政年份:2019
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
SHF: Medium: A Visual Cloud for Virtual Reality Applications
SHF:Medium:虚拟现实应用程序的视觉云
- 批准号:
1703051 - 财政年份:2017
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
IGERT-CIF21: Big Data U: A Program for Integrated Multidisciplinary Education and Research for Big Data Science
IGERT-CIF21:大数据 U:大数据科学综合多学科教育和研究计划
- 批准号:
1258485 - 财政年份:2013
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
CiC RDDC: Relational Data Markets in the Cloud
CiC RDDC:云中的关系数据市场
- 批准号:
1047815 - 财政年份:2011
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III: Large: Collaborative Research: SciDB - An Array Oriented Data Management System for Massive Scale Scientific Data
III:大型:协作研究:SciDB - 用于大规模科学数据的面向数组的数据管理系统
- 批准号:
1110370 - 财政年份:2011
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
CDI - Type II: Transforming Community-Based Elder Care through Heterogeneous Activity Sensing Analytics
CDI - II 类:通过异构活动感知分析转变基于社区的老年护理
- 批准号:
1028195 - 财政年份:2010
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CAREER: Interactive and Collaborative Data Management in the Cloud
职业:云中的交互式和协作数据管理
- 批准号:
0845397 - 财政年份:2009
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III-COR: Exploiting History in Continuous Monitoring Systems
III-COR:利用连续监测系统的历史
- 批准号:
0713123 - 财政年份:2007
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
III: Small: Computational Methods for Multi-dimensional Data Integration to Improve Phenotype Prediction
III:小:多维数据集成的计算方法以改进表型预测
- 批准号:
2246796 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: Efficient and Robust Multi-model Data Analytics for Edge Computing
协作研究:III:小型:边缘计算的高效、稳健的多模型数据分析
- 批准号:
2311596 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: Efficient and Robust Multi-model Data Analytics for Edge Computing
协作研究:III:小型:边缘计算的高效、稳健的多模型数据分析
- 批准号:
2311598 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III: Small: A Big Data and Machine Learning Approach for Improving the Efficiency of Two-sided Online Labor Markets
III:小:提高双边在线劳动力市场效率的大数据和机器学习方法
- 批准号:
2311582 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III: Small: Rethinking the Data Organization and Lifecycle in LSM Storage Systems
III:小:重新思考 LSM 存储系统中的数据组织和生命周期
- 批准号:
2227669 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III: Small: Statistical Inference through Data-Collection and Expert-Knowledge Incorporation
III:小:通过数据收集和专家知识整合进行统计推断
- 批准号:
2311969 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III: Small: Semantic Version Management in Data Lakes
III:小:数据湖中的语义版本管理
- 批准号:
2325632 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: Efficient and Robust Multi-model Data Analytics for Edge Computing
协作研究:III:小型:边缘计算的高效、稳健的多模型数据分析
- 批准号:
2311597 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III : Small : Integrating and Learning on Spatial Data via Multi-Agent Simulation
III:小:通过多智能体模拟集成和学习空间数据
- 批准号:
2311954 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
FET: III: Small: Innovative Approaches for Bias Correction and Systems-level Analysis in Integrated Multi-omics Data
FET:III:小型:集成多组学数据中的偏差校正和系统级分析的创新方法
- 批准号:
2203236 - 财政年份:2022
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant