CSR: Small: IRIS: A unified data access framework for the merging of compute-centric and data-centric storage

CSR:小型:IRIS:用于合并以计算为中心和以数据为中心的存储的统一数据访问框架

基本信息

  • 批准号:
    1814872
  • 负责人:
  • 金额:
    $ 50万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-01-01 至 2023-12-31
  • 项目状态:
    已结题

项目摘要

As the boundary between High Performance Computing (HPC) and High-Performance Data Analytics (HPDA) continue to blur, the conventional compute-centric HPC and the newly emerged data-driven Big Data application are converging. HPC becomes more data-intensive. In the meantime, HPDA requires more computing power. MapReduce and Spark software environments are developed and are popular for HPDA. However, these software frameworks are not designed for HPC and not compatible with HPC storage subsystems. In this research, the design and development of a unified data access framework, named IRIS, is proposed for the integration of compute-centric and data-centric storage solutions. The intellectual merit of this research is three-fold. 1) Mapping of incompatible structures: Mapping a file to key-value pairs and vice versa efficiently is a challenging task. 2) Maintaining metadata information: Since IRIS is a unified storage layer, it needs to maintain compatibility with legacy codes. IRIS will address this challenge with tunable consistency, which need to be carefully studied for implementation and design choices. 3) Minimizing overhead and memory footprint of IRIS solutions: Mapping of incompatible structures can cause excessive memory usage; this will be addressed in this research.This project is expected to have significant impact, including bridging data generation and data analysis processes; promoting collaboration between the model simulation and data analysis communities; and building a foundation element for next generation integrated storage systems. This research will create advanced solutions and technologies that will have direct impact on improving the efficiency of data access and management at scale. Since Big Data is a national strategic infrastructure for science, engineering, and industry, this research will advance a broad range of fields. It aims to make significant progress toward a unified storage access system. All data generated from this project will be stored in an electronic format and will be preserved on the server machines at the Illinois Institute of Technology (IIT): http://cs.iit.edu/~scs/. The server machines have hot-copy backup disks for backing up the primary copy of all data. A secondary copy of all data will be kept on the server machines in the computer science department at IIT per semester basis. The data will be transferred to new storage devices every 2 years. All data will be retained within 3 years of the project completion date.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
随着高性能计算(HPC)和高性能数据分析(HPDA)之间的界限不断模糊,传统的以计算为中心的HPC和新兴的数据驱动的大数据应用正在融合。HPC变得更加数据密集。与此同时,HPDA需要更多的计算能力。MapReduce和Spark软件环境被开发出来,并在HPDA中很受欢迎。但是,这些软件框架不是为HPC设计的,并且与HPC存储子系统不兼容。在这项研究中,设计和开发一个统一的数据访问框架,命名为IRIS,提出了以计算为中心的存储解决方案和以数据为中心的集成。 这项研究的学术价值有三个方面。1)不兼容结构的映射:有效地将文件映射到键值对,反之亦然是一项具有挑战性的任务。2)维护元数据信息:由于IRIS是一个统一的存储层,它需要保持与遗留代码的兼容性。IRIS将通过可调的一致性来应对这一挑战,这需要仔细研究实现和设计选择。3)最大限度地减少IRIS解决方案的开销和内存占用:不兼容结构的映射可能会导致过多的内存使用,这将在本研究中解决。本项目预计将产生重大影响,包括桥接数据生成和数据分析过程;促进模型模拟和数据分析社区之间的合作;以及为下一代集成存储系统构建基础元素。这项研究将创建先进的解决方案和技术,对提高大规模数据访问和管理的效率产生直接影响。由于大数据是科学,工程和工业的国家战略基础设施,这项研究将推动广泛的领域。它旨在朝着统一存储访问系统的方向取得重大进展。本项目产生的所有数据将以电子格式存储,并保存在伊利诺伊理工学院(IIT)的服务器上:http://cs.iit.edu/~scs/。服务器计算机具有热拷贝备份磁盘,用于备份所有数据的主副本。所有数据的第二份副本将保存在IIT计算机科学部门的服务器上,每学期一次。数据将每两年转移到新的存储设备。所有数据将在项目完成后的3年内保留。该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
LabStor: A Modular and Extensible Platform for Developing High-Performance, Customized I/O Stacks in Userspace
HFlow: A Dynamic and Elastic Multi-Layered I/O Forwarder
  • DOI:
    10.1109/cluster48925.2021.00064
  • 发表时间:
    2021-09
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jaime Cernuda Garcia;H. Devarajan;Luke Logan;Keith Bateman;N. Rajesh;Jie Ye;Anthony Kougkas;Xian-He Sun
  • 通讯作者:
    Jaime Cernuda Garcia;H. Devarajan;Luke Logan;Keith Bateman;N. Rajesh;Jie Ye;Anthony Kougkas;Xian-He Sun
Apollo:: An ML-assisted Real-Time Storage Resource Observer
DLIO: A Data-Centric Benchmark for Scientific Deep Learning Applications
Stimulus: Accelerate Data Management for Scientific AI applications in HPC
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Xian-He Sun其他文献

LPM: A Systematic Methodology for Concurrent Data Access Pattern Optimization from a Matching Perspective
LPM:从匹配角度优化并发数据访问模式的系统方法
Applications and Accuracy of the Parallel Diagonal Dominant
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xian-He Sun
  • 通讯作者:
    Xian-He Sun
Enhancing hybrid parallel file system through performance and space-aware data layout
通过性能和空间感知数据布局增强混合并行文件系统
HARL: Optimizing Parallel File Systems with Heterogeneity-Aware Region-Level Data Layout
HARL:使用异构感知区域级数据布局优化并行文件系统
Application and Accuracy of the Parallel Diagonal Dominant Algorithm
  • DOI:
    10.1016/0167-8191(95)00018-j
  • 发表时间:
    1995-08
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xian-He Sun
  • 通讯作者:
    Xian-He Sun

Xian-He Sun的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Xian-He Sun', 18)}}的其他基金

OAC Core: LABIOS: Storage Acceleration via Data Labeling and Asynchronous I/O
OAC 核心:LABIOS:通过数据标签和异步 I/O 进行存储加速
  • 批准号:
    2313154
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: CSR: Medium: Towards A Unified Memory-centric Computing System with Cross-layer Support
协作研究:CSR:中:迈向具有跨层支持的统一的以内存为中心的计算系统
  • 批准号:
    2310422
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
CNS Core: Small: Practical Memory Access Pattern Obfuscation with Algorithm, Application and Architecture Co-designs
CNS 核心:小型:通过算法、应用程序和架构协同设计进行实用内存访问模式混淆
  • 批准号:
    2152497
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Frameworks: Collaborative Research: ChronoLog: A High-Performance Storage Infrastructure for Activity and Log Workloads
框架:协作研究:ChronoLog:用于活动和日志工作负载的高性能存储基础架构
  • 批准号:
    2104013
  • 财政年份:
    2021
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Optimization of Memory Architectures: A Foundation Approach
合作研究:SHF:小型:内存架构优化:基础方法
  • 批准号:
    2008907
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Framework: Software: NSCI: Collaborative Research: Hermes: Extending the HDF Library to Support Intelligent I/O Buffering for Deep Memory and Storage Hierarchy Systems
框架: 软件:NSCI:协作研究:Hermes:扩展 HDF 库以支持深度内存和存储层次系统的智能 I/O 缓冲
  • 批准号:
    1835764
  • 财政年份:
    2018
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CRI: II-NEW: A Big Data Professing Infrastructure for Smart Energy Systems
CRI:II-NEW:智能能源系统的大数据专业基础设施
  • 批准号:
    1730488
  • 财政年份:
    2017
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Eager: Collaborative Research: DiRecMR: Reconciling the Dichotomy of MapReduce for Efficient Speculation and Resilience
Eager:协作研究:DiRecMR:调和 MapReduce 的二分法以实现高效推测和弹性
  • 批准号:
    1744317
  • 财政年份:
    2017
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CSR: Small: Empower Data-Intensive Computing: the integrated data management approach
CSR:小:赋能数据密集型计算:集成数据管理方法
  • 批准号:
    1526887
  • 财政年份:
    2015
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Utilizing Memory Parallelism for High Performance Data Processing
利用内存并行性进行高性能数据处理
  • 批准号:
    1536079
  • 财政年份:
    2015
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

CSR: Small: Leveraging Physical Side-Channels for Good
CSR:小:利用物理侧通道做好事
  • 批准号:
    2312089
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
NeTS: Small: NSF-DST: Modernizing Underground Mining Operations with Millimeter-Wave Imaging and Networking
NeTS:小型:NSF-DST:利用毫米波成像和网络实现地下采矿作业现代化
  • 批准号:
    2342833
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CPS: Small: NSF-DST: Autonomous Operations of Multi-UAV Uncrewed Aerial Systems using Onboard Sensing to Monitor and Track Natural Disaster Events
CPS:小型:NSF-DST:使用机载传感监测和跟踪自然灾害事件的多无人机无人航空系统自主操作
  • 批准号:
    2343062
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Small: Reservoir Computing with Ion-Channel-Based Memristors
合作研究:FET:小型:基于离子通道忆阻器的储层计算
  • 批准号:
    2403559
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
オミックス解析を用いたブドウ球菌 small colony variants の包括的特徴づけ
使用组学分析全面表征葡萄球菌小菌落变体
  • 批准号:
    24K13443
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
AF: Small: Problems in Algorithmic Game Theory for Online Markets
AF:小:在线市场的算法博弈论问题
  • 批准号:
    2332922
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Small: Algorithmic Self-Assembly with Crisscross Slats
合作研究:FET:小型:十字交叉板条的算法自组装
  • 批准号:
    2329908
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
NeTS: Small: ML-Driven Online Traffic Analysis at Multi-Terabit Line Rates
NeTS:小型:ML 驱动的多太比特线路速率在线流量分析
  • 批准号:
    2331111
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
  • 批准号:
    2331302
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
  • 批准号:
    2331301
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了