CSR-DMSS, SM: Incremental Web-scale Data Processing
CSR-DMSS、SM:增量网络规模数据处理
基本信息
- 批准号:0834784
- 负责人:
- 金额:$ 10万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2008
- 资助国家:美国
- 起止时间:2008-09-01 至 2009-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This project seeks to develop incremental processing abstractions andtechnologies to address the approaching bottleneck in processingunstructured web-scale data. Government, medical, financial, and web-basedservices increasingly depend on the ability to rapidly sift through huge,evolving data sets. These data-intensive applications perform complexmulti-step computations over successive generations of data inflows (e.g.,weekly web crawls or nightly telescope dumps). Current approaches toprocessing unstructured data have driven the development of massivelyparallel "ad-hoc" data processing systems, such as MapReduce. However,they process data in a snap-shot fashion, forcing massive re-computationswhen even a small amount of new data arrives.The core of the project consists of a cluster-based incremental dataprocessing system that overcomes these limitations. A key component is adataflow programming model that combines massive parallelism and flexible,incremental computations. An incremental processing controllerorchestrates multiple backend data processing tasks, ensuring reliable,consistent operation in the event of node failures. The project seeks toshed light on the fundamental challenges and benefits of incrementalprocessing for ad-hoc data by using both industrial and e-scienceapplications. For example, through cooperation with Yahoo! Research, theproject will vet existing prototypes on real-world web-indexing dataflowsand large data sets. While in the short term the project provides aplatform for such highly skilled operators, the long-term goal is tosignificantly advance the methods and abstractions that the scientificcommunity and commercial world use to tackle processing vast, dynamic datasets.
该项目旨在开发增量处理抽象和技术,以解决处理非结构化网络规模数据的瓶颈问题。 政府、医疗、金融和基于网络的服务越来越依赖于快速筛选庞大、不断变化的数据集的能力。 这些数据密集型应用程序在连续几代数据流入上执行复杂的多步计算(例如,每周网络抓取或每晚望远镜转储)。 当前处理非结构化数据的方法已经推动了并行“ad-hoc”数据处理系统的发展,例如MapReduce。 然而,它们以快照的方式处理数据,即使是少量的新数据到达时,也会迫使大量的重新计算。该项目的核心是一个基于集群的增量数据处理系统,它克服了这些限制。 一个关键组件是adataflow编程模型,它结合了大量的并行性和灵活的增量计算。 增量处理队列可协调多个后端数据处理任务,确保在发生节点故障时可靠、一致地运行。 该项目旨在阐明通过使用工业和电子科学应用程序对特定数据进行增量处理的基本挑战和好处。 例如,通过与Yahoo!研究,该项目将审查现有的原型在现实世界中的网络索引数据库和大型数据集。 虽然在短期内,该项目为这些高技能的操作人员提供了一个平台,但长期目标是显著推进科学界和商业界用于处理大量动态数据集的方法和抽象。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Kenneth Yocum其他文献
Kenneth Yocum的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Kenneth Yocum', 18)}}的其他基金
CiC (RDDC): Continuous Bulk Processing in the Cloud
CiC (RDDC):云端连续批量处理
- 批准号:
1048296 - 财政年份:2011
- 资助金额:
$ 10万 - 项目类别:
Standard Grant
CSR: Small: High-Fidelity Datacenter Emulation
CSR:小型:高保真数据中心仿真
- 批准号:
1018808 - 财政年份:2010
- 资助金额:
$ 10万 - 项目类别:
Standard Grant
NeTS: Small: Topology Switching for Data Centers and the Clouds Above
NetS:小型:数据中心和上方云的拓扑切换
- 批准号:
0917339 - 财政年份:2009
- 资助金额:
$ 10万 - 项目类别:
Standard Grant
相似海外基金
CSR-DMSS,SM: Cooperative Activity Analysis in Wireless Smart-Camera Networks (Wi-SCaNs)
CSR-DMSS,SM:无线智能相机网络 (Wi-SCaN) 中的协作活动分析
- 批准号:
1205458 - 财政年份:2011
- 资助金额:
$ 10万 - 项目类别:
Standard Grant
CSR-DMSS, SM: ConfVeal: Automated Testing of Security Configuration Enforcement in Distributed Networks
CSR-DMSS、SM:ConfVeal:分布式网络中安全配置实施的自动化测试
- 批准号:
1019223 - 财政年份:2010
- 资助金额:
$ 10万 - 项目类别:
Standard Grant
CSR-DMSS, SM, Harmony: Efficient Integrated Resource/Trust Management in Large-Scale Distributed Systems
CSR-DMSS、SM、Harmony:大规模分布式系统中的高效集成资源/信任管理
- 批准号:
1025649 - 财政年份:2009
- 资助金额:
$ 10万 - 项目类别:
Standard Grant
CSR-DMSS, SM: Energy-Efficient and Reliability-Aware Data Management in Mobile Storage Systems
CSR-DMSS、SM:移动存储系统中的节能和可靠性感知数据管理
- 批准号:
0834466 - 财政年份:2008
- 资助金额:
$ 10万 - 项目类别:
Continuing Grant
CSR-DMSS, SM: View Control Management in Geographically Distributed Tele-Immersive Environments
CSR-DMSS、SM:地理分布式远程沉浸式环境中的视图控制管理
- 批准号:
0834480 - 财政年份:2008
- 资助金额:
$ 10万 - 项目类别:
Continuing Grant
CSR-DMSS, SM, Harmony: Efficient Integrated Resource/Trust Management in Large-Scale Distributed Systems
CSR-DMSS、SM、Harmony:大规模分布式系统中的高效集成资源/信任管理
- 批准号:
0834592 - 财政年份:2008
- 资助金额:
$ 10万 - 项目类别:
Standard Grant
CSR-DMSS, SM: Aeolus: Secure Support for Preserving Confidentiality and Integrity in a Distributed Environment
CSR-DMSS、SM:Aeolus:在分布式环境中保护机密性和完整性的安全支持
- 批准号:
0834239 - 财政年份:2008
- 资助金额:
$ 10万 - 项目类别:
Continuing Grant
CSR-DMSS, SM: A Holistic Approach to Reliable Pervasive Systems
CSR-DMSS、SM:实现可靠普及系统的整体方法
- 批准号:
0834529 - 财政年份:2008
- 资助金额:
$ 10万 - 项目类别:
Continuing Grant
CSR-DMSS, SM: Web on Demand - Bridging the Gap Between Social Networks and Ad Hoc Networking
CSR-DMSS、SM:Web on Demand - 弥合社交网络和 Ad Hoc 网络之间的差距
- 批准号:
0834545 - 财政年份:2008
- 资助金额:
$ 10万 - 项目类别:
Continuing Grant