NeTS: CSR: Medium: Collaborative Research: Enabling Flexible and High Performance Big Data Analytics Over Geo-Distributed Clouds

NeTS:CSR:中:协作研究:通过地理分布式云实现灵活且高性能的大数据分析

基本信息

项目摘要

Large organizations and small enterprises alike leverage datacenters across the globe to offer Internet services to their users. These sites routinely gather data pertaining to end user activities to provide better services, and they collect server monitoring logs and performance counters to ensure uninterrupted service. Although fast, efficient, and cost-effective analyses of these large datasets can significantly improve users' quality of experience and enable novel applications, the wide area network (WAN) that connects the datacenters poses a considerable challenge: because WAN bandwidth is limited and expensive, and WAN latency is high and variable, both the performance and timeliness of analytics are affected by the WAN.This project aims to build a new WAN-aware big data stack customized for flexible geo-distributed data analytics. The project will not impose any constraints on the set of queries that can be issued, and it will support a variety of performance objectives including obtaining timely responses, minimizing batch completion times, or using minimal bandwidth. To account for unpredictable and fine-timescale changes to WAN conditions and to enable coordination among the actions taken by different layers of the analytics stack, this project will enable holistic, cross-layer visibility and optimizations. It will incorporate awareness of the geo-distributed setting in the stack's upper layers (e.g., query optimization) and of application-level objectives in the lower layers (e.g., networking). This will result in a radical re-factoring of the API and interfaces between query optimization, query execution, resource negotiation, wide-area storage, and network routing/scheduling.Software artifacts from this project will be incorporated into existing open source big data stacks, making the research outcomes broadly available for public reuse. The experimental harnesses will be made available to ensure repeatability and to foster follow up research. The research outcomes will guide industry evolution as the industry slowly shifts from single-datacenter to geo-distributed settings. The project has a substantial educational component involving the introduction of new courses on big data systems at both graduate and undergraduate levels that will involve hands-on exercises with state-of-the-art big data software, and it will reach out to high-school students, women, and underrepresented minorities through big data boot camps.
大型组织和小型企业都利用遍布地球仪的因特网中心向其用户提供因特网服务。这些站点定期收集与最终用户活动有关的数据以提供更好的服务,并且它们收集服务器监视日志和性能计数器以确保不间断的服务。尽管对这些大型数据集进行快速、高效和经济高效的分析可以显著提高用户体验质量并实现新的应用,但连接数据中心的广域网(WAN)带来了相当大的挑战:由于WAN带宽有限且昂贵,WAN延迟高且可变,分析的性能和及时性都受到广域网的影响。该项目旨在构建一个新的广域网感知的大数据堆栈,用于灵活的地理分布数据分析。该项目不会对可以发出的查询集施加任何约束,并且它将支持各种性能目标,包括获得及时响应,最小化批处理完成时间或使用最小带宽。为了应对WAN条件的不可预测和精细的时间尺度变化,并协调分析堆栈不同层所采取的行动,该项目将实现整体的跨层可见性和优化。它将在堆栈的上层(例如,查询优化)和较低层中的应用级目标(例如,网络)。这将导致对API以及查询优化、查询执行、资源协商、广域存储和网络路由/调度之间的接口进行彻底的重构。该项目的软件工件将被纳入现有的开源大数据堆栈,使研究成果广泛用于公共重用。将提供实验性线束,以确保可重复性并促进后续研究。研究成果将指导行业发展,因为行业慢慢从单一数据中心转向地理分布式设置。该项目有一个实质性的教育部分,涉及在研究生和本科生两级开设关于大数据系统的新课程,其中将涉及使用最先进的大数据软件的实践练习,并将通过大数据靴子训练营向高中生、妇女和代表性不足的少数群体进行宣传。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Mosharaf Chowdhury其他文献

CDI-E: An Elastic Cloud Service for Data Engineering
CDI-E:数据工程的弹性云服务
  • DOI:
    10.14778/3554821.3554825
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Prakash Das;Shivangi Srivastava;Valentin Moskovich;Anmol Chaturvedi;Anant Mittal;Yongqin Xiao;Mosharaf Chowdhury
  • 通讯作者:
    Mosharaf Chowdhury
Fair Allocation of Heterogeneous and InterchangeableResources
异构和可互换资源的公平分配
  • DOI:
    10.1145/3305218.3305227
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xiao Sun;T. Le;Mosharaf Chowdhury;Zhenhua Liu
  • 通讯作者:
    Zhenhua Liu
Pyxis: Scheduling Mixed Tasks in Disaggregated Datacenters
Pyxis:在分类数据中心调度混合任务
Coflow: A Networking Abstraction for Distributed Data-Parallel Applications
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Mosharaf Chowdhury
  • 通讯作者:
    Mosharaf Chowdhury
Resource Management in Multi-* Clusters : Cloud Provisioning
多*集群中的资源管理:云配置
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Mosharaf Chowdhury
  • 通讯作者:
    Mosharaf Chowdhury

Mosharaf Chowdhury的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Mosharaf Chowdhury', 18)}}的其他基金

Collaborative Research: Conference: NSF NeTS PI Meeting - Spring 2023
协作研究:会议:NSF NeTS PI 会议 - 2023 年春季
  • 批准号:
    2309858
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Collaborative Research: NGSDI: Foundations of Clean and Balanced Datacenters: Treehouse
合作研究:NGSDI:清洁和平衡数据中心的基础:Treehouse
  • 批准号:
    2104243
  • 财政年份:
    2021
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
Collaborative Research: CNS Core: Medium: Systems Support for Federated Learning
协作研究:CNS 核心:中:联邦学习的系统支持
  • 批准号:
    2106184
  • 财政年份:
    2021
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
CNS Core: Medium: Collaborative Research: Towards Enabling Optimal Performance-Cost Tradeoffs in Distributed Storage
CNS 核心:中:协作研究:实现分布式存储中的最佳性能与成本权衡
  • 批准号:
    1900665
  • 财政年份:
    2019
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
CAREER: End-to-End Network Design for Unified Memory Disaggregation
职业:统一内存分解的端到端网络设计
  • 批准号:
    1845853
  • 财政年份:
    2019
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
CNS Core: Small: Multi-Scale GPU Resource Management for AI Applications
CNS 核心:小型:AI 应用的多规模 GPU 资源管理
  • 批准号:
    1909067
  • 财政年份:
    2019
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
XPS: FULL: A Cross-Layer Approach Toward Low-Latency Data-Parallel Applications in Rack-Scale Computing
XPS:FULL:机架规模计算中低延迟数据并行应用的跨层方法
  • 批准号:
    1629397
  • 财政年份:
    2016
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
NeTS: Small: Collaborative Research: Enabling Application-Level Performance Predictability in Public Clouds
NeTS:小型:协作研究:在公共云中实现应用程序级性能可预测性
  • 批准号:
    1617773
  • 财政年份:
    2016
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant

相似国自然基金

基于经筋理论的筋针与整脊联合疗法治疗 CSR疼痛的临床应用研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
RAC2(G15D)突变参与B细胞 Ig-CSR过程的分子机制研究
  • 批准号:
    2025JJ80630
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于CRISPR/CasRx调控CSR1基因表达预防氨基糖甙类耳毒性聋研究
  • 批准号:
    2024Y9183
  • 批准年份:
    2024
  • 资助金额:
    25.0 万元
  • 项目类别:
    省市级项目
基于Piezo机械敏感通道探讨奉伸松调法调控颈肌细胞自噬与DRG痛觉感受神经元可塑性治疗CSR的作用机制
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0 万元
  • 项目类别:
    地区科学基金项目
准社会互动视角下CSR数字化沟通对品牌绩效的差异化影响、机制与管理对策
  • 批准号:
    72362008
  • 批准年份:
    2023
  • 资助金额:
    28 万元
  • 项目类别:
    地区科学基金项目
善行得善果?后疫情时代嵌入式和边缘式CSR对员工幸福感的跨层影响研究
  • 批准号:
    72102183
  • 批准年份:
    2021
  • 资助金额:
    24.00 万元
  • 项目类别:
    青年科学基金项目
善行得善果?后疫情时代嵌入式和边缘式CSR对员工幸福感的跨层影响研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    30 万元
  • 项目类别:
基于脊髓突触可塑性探讨“调气”电针远端腧穴干预CSR模型大鼠的中枢镇痛效应及机制研究
  • 批准号:
    82160934
  • 批准年份:
    2021
  • 资助金额:
    34 万元
  • 项目类别:
    地区科学基金项目
利用输运模型和机器学习方法研究CSR能区的低温高密核物质
  • 批准号:
    U2032145
  • 批准年份:
    2020
  • 资助金额:
    50.0 万元
  • 项目类别:
    联合基金项目
基于兰州HIRFL-CSR装置对轻原子核的团簇结构及晕结构的理论研究
  • 批准号:
    U2032137
  • 批准年份:
    2020
  • 资助金额:
    60.0 万元
  • 项目类别:
    联合基金项目

相似海外基金

CSR: Medium: Improving the Interface between Machine Learning and Software Systems
CSR:中:改进机器学习和软件系统之间的接口
  • 批准号:
    2313190
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Collaborative Research: CSR: Medium: Scaling Secure Serverless Computing on Heterogeneous Datacenters
协作研究:CSR:中:在异构数据中心上扩展安全无服务器计算
  • 批准号:
    2312206
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
Collaborative Research: CSR: Medium: Architecting GPUs for Practical Homomorphic Encryption-based Computing
协作研究:CSR:中:为实用的同态加密计算构建 GPU
  • 批准号:
    2312276
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
Collaborative Research: CSR: Medium: Fortuna: Characterizing and Harnessing Performance Variability in Accelerator-rich Clusters
合作研究:CSR:Medium:Fortuna:表征和利用富含加速器的集群中的性能变异性
  • 批准号:
    2312689
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
Collaborative Research: CSR: Medium: Fortuna: Characterizing and Harnessing Performance Variability in Accelerator-rich Clusters
合作研究:CSR:Medium:Fortuna:表征和利用富含加速器的集群中的性能变异性
  • 批准号:
    2401244
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
Collaborative Research: CSR: Medium: Scaling Secure Serverless Computing on Heterogeneous Datacenters
协作研究:CSR:中:在异构数据中心上扩展安全无服务器计算
  • 批准号:
    2312207
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
Collaborative Research: CSR: Medium: Adaptive Environmental Awareness for Collaborative Augmented Reality
协作研究:企业社会责任:媒介:协作增强现实的自适应环境意识
  • 批准号:
    2312760
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
Collaborative Research: CSR: Core: Medium: Scaling Unix/Linux Shell Programs
协作研究:CSR:核心:中:扩展 Unix/Linux Shell 程序
  • 批准号:
    2312346
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
Collaborative Research: CSR: Medium: MemDrive: Memory-Driven Full-Stack Collaboration for Autonomous Embedded Systems
协作研究:CSR:媒介:MemDrive:自主嵌入式系统的内存驱动全栈协作
  • 批准号:
    2312397
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
Collaborative Research: CSR: Medium: MemDrive: Memory-Driven Full-Stack Collaboration for Autonomous Embedded Systems
协作研究:CSR:媒介:MemDrive:自主嵌入式系统的内存驱动全栈协作
  • 批准号:
    2312396
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了