BIGDATA: Small: DCM: Collaborative Research: An efficient, versatile, scalable, and portable storage system for scientific data containers
大数据:小型:DCM:协作研究:用于科学数据容器的高效、多功能、可扩展和便携式存储系统
基本信息
- 批准号:1251137
- 负责人:
- 金额:$ 44.43万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2013
- 资助国家:美国
- 起止时间:2013-07-01 至 2017-06-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Scientific Bigdata sets are becoming too large and complex to fit in RAM, forcing scientific applications to perform a lot of slow disk and network I/O. This growth also makes scientific data more vulnerable to corruptions due to crashes and human errors. This project will use recent results from algorithms, database, and storage research to improve the performance and reliability of standard scientific data formats. This will make scientific research cheaper, faster, more reliable, and more reproducible.The Hierarchical Data Format (HDF5) standard is a container format for scientific data. It allows scientists to define and store complex data structures inside HDF5 files. Unfortunately, the current standard forces users to store all data objects and their meta-data properties inside one large physical file; this mix hinders meta-data-specific optimizations. The current storage also uses data-structures that scale poorly for large data. Lastly, the current model lacks snapshot support, important for recovery from errors.A new HDF5 release allows users to create more versatile storage plugins to control storage policies on each object and attribute. This project is developing support for snapshots in HDF5, designing new data structures and algorithms to scale HDF5 data access on modern storage devices to Bigdata. The project is designing several new HDF5 drivers: mapping objects to a Linux file system; storing objects in a database; and accessing data objects on remote Web servers. These improvements are evaluated using large-scale visualization applications with Bigdata, stemming from real-world scientific computations.
科学大数据集变得过于庞大和复杂,无法容纳在RAM中,迫使科学应用程序执行大量缓慢的磁盘和网络I/O。 这种增长也使科学数据更容易受到崩溃和人为错误的影响。 该项目将利用算法、数据库和存储研究的最新成果来提高标准科学数据格式的性能和可靠性。 这将使科学研究更便宜,更快,更可靠,更可重复。分层数据格式(HDF 5)标准是科学数据的容器格式。 它允许科学家在HDF 5文件中定义和存储复杂的数据结构。 不幸的是,当前的标准强制用户将所有数据对象及其元数据属性存储在一个大的物理文件中;这种混合阻碍了特定于元数据的优化。 当前的存储还使用了对于大数据来说伸缩性很差的数据结构。最后,当前模型缺乏快照支持,这对于从错误中恢复很重要。新的HDF 5版本允许用户创建更通用的存储插件来控制每个对象和属性的存储策略。 该项目正在开发对HDF 5中快照的支持,设计新的数据结构和算法,以将现代存储设备上的HDF 5数据访问扩展到Bigdata。该项目正在设计几个新的HDF 5驱动程序:将对象映射到Linux文件系统;将对象存储在数据库中;以及访问远程Web服务器上的数据对象。 这些改进是使用Bigdata的大规模可视化应用程序进行评估的,这些应用程序源自真实世界的科学计算。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Erez Zadok其他文献
Software monitoring with controllable overhead
- DOI:
10.1007/s10009-010-0184-4 - 发表时间:
2010-12-29 - 期刊:
- 影响因子:1.400
- 作者:
Xiaowan Huang;Justin Seyster;Sean Callanan;Ketan Dixit;Radu Grosu;Scott A. Smolka;Scott D. Stoller;Erez Zadok - 通讯作者:
Erez Zadok
Erez Zadok的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Erez Zadok', 18)}}的其他基金
Collaborative Research: CyberTraining: Implementation: Medium: FOUNT: Scaffolded, Hands-On Learning for a Data-Centric Future
协作研究:网络培训:实施:媒介:FOUNT:支架式实践学习,打造以数据为中心的未来
- 批准号:
2230078 - 财政年份:2022
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
Collaborative Research: CNS Core: Medium: Secure, Reliable, and Efficient Long-Term Storage
合作研究:CNS核心:中:安全、可靠、高效的长期存储
- 批准号:
2106263 - 财政年份:2021
- 资助金额:
$ 44.43万 - 项目类别:
Continuing Grant
Collaborative Research: CNS Core: Medium: Optimizing Storage Caches via Adaptive and Reconfigurable Tiering
协作研究:CNS 核心:中:通过自适应和可重新配置分层优化存储缓存
- 批准号:
2106434 - 财政年份:2021
- 资助金额:
$ 44.43万 - 项目类别:
Continuing Grant
CNS Core: III: Medium: Collaborative Research: Optimizing and Understanding Large Parameter Spaces in Storage Systems
CNS 核心:III:中:协作研究:优化和理解存储系统中的大参数空间
- 批准号:
1900706 - 财政年份:2019
- 资助金额:
$ 44.43万 - 项目类别:
Continuing Grant
FMitF: Track I: NLP-Assisted Formal Verification of the NFS Distributed File System Protocol
FMITF:第一轨:NLP 辅助 NFS 分布式文件系统协议的形式验证
- 批准号:
1918225 - 财政年份:2019
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
Collaborative Research: CI-SUSTAIN: National File System Trace Repository
合作研究:CI-SUSTAIN:国家文件系统跟踪存储库
- 批准号:
1729939 - 财政年份:2017
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
Student Travel Support for the 13th USENIX File and Storage Technologies conference (FASTI 2015)
第 13 届 USENIX 文件和存储技术会议 (FASTI 2015) 的学生旅行支持
- 批准号:
1522834 - 财政年份:2015
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
CSR: Medium: Collaborative Research: Workload-Aware Storage Architectures for Optimal Performance and Energy Efficiency
CSR:中:协作研究:实现最佳性能和能源效率的工作负载感知存储架构
- 批准号:
1302246 - 财政年份:2013
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
TTP: Small: NFS4Sec: An Extensible Security Layer for Network Storage
TTP:小:NFS4Sec:网络存储的可扩展安全层
- 批准号:
1223239 - 财政年份:2012
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
Student Travel Support for the First USENIX Workshop on Sustainable Information Technology (SustainIT 2010)
首届 USENIX 可持续信息技术研讨会 (SustainIT 2010) 的学生差旅支持
- 批准号:
0968748 - 财政年份:2010
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
BIGDATA: Small: DCM: Collaborative Research: An efficient, versatile, scalable, and portable storage system for scientific data containers
大数据:小型:DCM:协作研究:用于科学数据容器的高效、多功能、可扩展和便携式存储系统
- 批准号:
1723292 - 财政年份:2017
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
BIGDATA: Small: DCM: Data Management for Analytics Applications on Modern Architecture
BIGDATA:小型:DCM:现代架构上分析应用程序的数据管理
- 批准号:
1250886 - 财政年份:2013
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
BIGDATA: Small: DA: DCM: Measurement and Learning in Large-Scale Social Networks
BIGDATA:小型:DA:DCM:大规模社交网络中的测量和学习
- 批准号:
1251267 - 财政年份:2013
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
BIGDATA: Small: DCM: JetStream: A Flexible Distributed System for Online and In-Place Data Analysis
BIGDATA:小型:DCM:JetStream:用于在线和就地数据分析的灵活分布式系统
- 批准号:
1250990 - 财政年份:2013
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
BIGDATA: Small: DCM: DA: Building a Mergeable and Interactive Distributed Data Layer for Big Data Summarization Systems
BIGDATA:小型:DCM:DA:为大数据汇总系统构建可合并和交互式的分布式数据层
- 批准号:
1251019 - 财政年份:2013
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
BIGDATA: Small: DCM: Collaborative Research: An efficient, versatile, scalable, and portable storage system for scientific data containers
大数据:小型:DCM:协作研究:用于科学数据容器的高效、多功能、可扩展和便携式存储系统
- 批准号:
1251037 - 财政年份:2013
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
BIGDATA: Small: DCM: Collaborative Research: An efficient, versatile, scalable, and portable storage system for scientific data containers
大数据:小型:DCM:协作研究:用于科学数据容器的高效、多功能、可扩展和便携式存储系统
- 批准号:
1251095 - 财政年份:2013
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
BIGDATA: Small: DCM: DA: Collaborative Research: SMASH -- Scalable Multimedia content AnalysiS in a High-level language
大数据: 小: DCM: DA: 协作研究: SMASH - 使用高级语言进行可扩展多媒体内容分析
- 批准号:
1251276 - 财政年份:2013
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
BIGDATA: Small: DCM: ESCE: Condensate Database for Efficient Anomaly Detection and Quality Assurance of Massive Cryospheric Data
大数据:小型:DCM:ESCE:用于高效异常检测和海量冰冻圈数据质量保证的凝结水数据库
- 批准号:
1251257 - 财政年份:2013
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
BIGDATA: Small: DCM: Open Flow Enabled Hadoop over Local and Wide Area Clusters
BIGDATA:小型:DCM:本地和广域集群上支持开放流的 Hadoop
- 批准号:
1251201 - 财政年份:2013
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant