CSR: Small: Empower Data-Intensive Computing: the integrated data management approach

CSR:小:赋能数据密集型计算:集成数据管理方法

基本信息

  • 批准号:
    1526887
  • 负责人:
  • 金额:
    $ 40万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2015
  • 资助国家:
    美国
  • 起止时间:
    2015-09-01 至 2019-08-31
  • 项目状态:
    已结题

项目摘要

From the computer system point of view there are two types of digital data: observational data, the data collected by electrical devices such as sensor, monitor, camera, text, etc.; and simulation data, data generated by computing. The former represents newly emerged internet data-driven applications, such as social media and data analytic; and the latter represents the conventional computing-driven applications, such as climate modeling and computational fluid dynamics. In general, the latter requires strong consistency for correctness and the former does not. The difference in consistency leads to two kinds of file systems: data-intensive distributed file system, represented by the MapReduce-based Hadoop distributed file systems (HDFS); and computing-intensive file systems, represented by the high performance parallel file systems (PFS), such as the IBM general parallel file system (GPFS). These two kinds of file systems are designed with different philosophies, for different applications, and do not talk to each other. Understanding huge amounts of collected data depends on powerful computation, whereas large-scale computation requires the management of large data. Therefore, big data applications demand an integrated solution. The integrated data access system (IDAS) developed under this research is designed to bridge the data management gap.In agreement with the CAP theory in the distributed system design, the IDAS approach is not designed as a new standalone system but as a software layer which provides an integrated interface to conduct cross-platform data access, from HDFS to PFS, or from PFS to HDFS, read or write, effectively and interchangeably without changing the users' applications. The development plan for IDAS has three components: 1) establish the communication channels so that data can be accessed between HDFS and PFS; 2) design an extended semantic interface so that different file systems can be accessed under different computing systems; 3) develop optimization techniques to optimize I/O operation under HDFS, PFS, and under IDAS. Big data requires a joint effort of the data-driven internet computing community and the compute-driven scientific computing community. IDAS provides a sustainable, cost-effective infrastructure for cross-platform, cross-community services of data storage, access, and sharing. This research will create advanced solutions and technologies that will have direct impact on improving the efficiency of data access and management at scale. Since big data is a national strategic infrastructure for science, engineering, and industry, the proposed investigations will advance a broad range of fields. The success of this research will strive to make significant progress of a timely, important, highly challenging, and high-impact problem, namely integrated data access system.
从计算机系统的角度来看,数字数据有两种类型:观测数据,由传感器、监视器、摄像机、文本等电子设备采集的数据;和模拟数据,通过计算产生的数据。前者代表新兴的互联网数据驱动应用,如社交媒体和数据分析;后者代表传统的计算驱动应用,如气候建模和计算流体动力学。一般来说,后者需要强一致性的正确性,而前者不需要。一致性的差异导致了两种文件系统:数据密集型分布式文件系统,以基于MapReduce的Hadoop分布式文件系统(HDFS)为代表;计算密集型文件系统,以高性能并行文件系统(PFS)为代表,如IBM通用并行文件系统(GPFS)。这两种文件系统是根据不同的原理设计的,用于不同的应用程序,并且彼此不通信。理解大量收集的数据依赖于强大的计算,而大规模计算需要管理大量数据。因此,大数据应用需要集成解决方案。本研究所开发的集成数据访问系统(IDAS)旨在弥补数据管理的不足,与分布式系统设计中的CAP理论相一致,IDAS方法不是设计成一个新的独立系统,而是作为一个软件层,提供一个集成接口来进行跨平台的数据访问,从HDFS到PFS,或从PFS到HDFS,读或写,有效地和可互换地,而不改变用户的应用。IDAS的开发计划有三个组成部分:1)建立通信通道,使数据可以在HDFS和PFS之间访问; 2)设计一个扩展的语义接口,使不同的文件系统可以在不同的计算系统下访问; 3)开发优化技术,以优化HDFS,PFS和IDAS下的I/O操作。大数据需要数据驱动的互联网计算社区和计算驱动的科学计算社区的共同努力。IDAS为跨平台、跨社区的数据存储、访问和共享服务提供了一个可持续的、具有成本效益的基础设施。这项研究将创建先进的解决方案和技术,对提高大规模数据访问和管理的效率产生直接影响。由于大数据是科学,工程和工业的国家战略基础设施,因此拟议的调查将推动广泛的领域。本研究的成功将力争使一个及时、重要、极具挑战性、影响力大的问题,即集成数据访问系统取得重大进展。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Xian-He Sun其他文献

LPM: A Systematic Methodology for Concurrent Data Access Pattern Optimization from a Matching Perspective
LPM:从匹配角度优化并发数据访问模式的系统方法
Applications and Accuracy of the Parallel Diagonal Dominant
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xian-He Sun
  • 通讯作者:
    Xian-He Sun
Enhancing hybrid parallel file system through performance and space-aware data layout
通过性能和空间感知数据布局增强混合并行文件系统
HARL: Optimizing Parallel File Systems with Heterogeneity-Aware Region-Level Data Layout
HARL:使用异构感知区域级数据布局优化并行文件系统
Application and Accuracy of the Parallel Diagonal Dominant Algorithm
  • DOI:
    10.1016/0167-8191(95)00018-j
  • 发表时间:
    1995-08
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xian-He Sun
  • 通讯作者:
    Xian-He Sun

Xian-He Sun的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Xian-He Sun', 18)}}的其他基金

OAC Core: LABIOS: Storage Acceleration via Data Labeling and Asynchronous I/O
OAC 核心:LABIOS:通过数据标签和异步 I/O 进行存储加速
  • 批准号:
    2313154
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Collaborative Research: CSR: Medium: Towards A Unified Memory-centric Computing System with Cross-layer Support
协作研究:CSR:中:迈向具有跨层支持的统一的以内存为中心的计算系统
  • 批准号:
    2310422
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
CNS Core: Small: Practical Memory Access Pattern Obfuscation with Algorithm, Application and Architecture Co-designs
CNS 核心:小型:通过算法、应用程序和架构协同设计进行实用内存访问模式混淆
  • 批准号:
    2152497
  • 财政年份:
    2022
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Frameworks: Collaborative Research: ChronoLog: A High-Performance Storage Infrastructure for Activity and Log Workloads
框架:协作研究:ChronoLog:用于活动和日志工作负载的高性能存储基础架构
  • 批准号:
    2104013
  • 财政年份:
    2021
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Optimization of Memory Architectures: A Foundation Approach
合作研究:SHF:小型:内存架构优化:基础方法
  • 批准号:
    2008907
  • 财政年份:
    2020
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
CSR: Small: IRIS: A unified data access framework for the merging of compute-centric and data-centric storage
CSR:小型:IRIS:用于合并以计算为中心和以数据为中心的存储的统一数据访问框架
  • 批准号:
    1814872
  • 财政年份:
    2019
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Framework: Software: NSCI: Collaborative Research: Hermes: Extending the HDF Library to Support Intelligent I/O Buffering for Deep Memory and Storage Hierarchy Systems
框架: 软件:NSCI:协作研究:Hermes:扩展 HDF 库以支持深度内存和存储层次系统的智能 I/O 缓冲
  • 批准号:
    1835764
  • 财政年份:
    2018
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
CRI: II-NEW: A Big Data Professing Infrastructure for Smart Energy Systems
CRI:II-NEW:智能能源系统的大数据专业基础设施
  • 批准号:
    1730488
  • 财政年份:
    2017
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Eager: Collaborative Research: DiRecMR: Reconciling the Dichotomy of MapReduce for Efficient Speculation and Resilience
Eager:协作研究:DiRecMR:调和 MapReduce 的二分法以实现高效推测和弹性
  • 批准号:
    1744317
  • 财政年份:
    2017
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Utilizing Memory Parallelism for High Performance Data Processing
利用内存并行性进行高性能数据处理
  • 批准号:
    1536079
  • 财政年份:
    2015
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Powering Small Craft with a Novel Ammonia Engine
用新型氨发动机为小型船只提供动力
  • 批准号:
    10099896
  • 财政年份:
    2024
  • 资助金额:
    $ 40万
  • 项目类别:
    Collaborative R&D
"Small performances": investigating the typographic punches of John Baskerville (1707-75) through heritage science and practice-based research
“小型表演”:通过遗产科学和基于实践的研究调查约翰·巴斯克维尔(1707-75)的印刷拳头
  • 批准号:
    AH/X011747/1
  • 财政年份:
    2024
  • 资助金额:
    $ 40万
  • 项目类别:
    Research Grant
Fragment to small molecule hit discovery targeting Mycobacterium tuberculosis FtsZ
针对结核分枝杆菌 FtsZ 的小分子片段发现
  • 批准号:
    MR/Z503757/1
  • 财政年份:
    2024
  • 资助金额:
    $ 40万
  • 项目类别:
    Research Grant
Bacteriophage control of host cell DNA transactions by small ORF proteins
噬菌体通过小 ORF 蛋白控制宿主细胞 DNA 交易
  • 批准号:
    BB/Y004426/1
  • 财政年份:
    2024
  • 资助金额:
    $ 40万
  • 项目类别:
    Research Grant
Windows for the Small-Sized Telescope (SST) Cameras of the Cherenkov Telescope Array (CTA)
切伦科夫望远镜阵列 (CTA) 小型望远镜 (SST) 相机的窗口
  • 批准号:
    ST/Z000017/1
  • 财政年份:
    2024
  • 资助金额:
    $ 40万
  • 项目类别:
    Research Grant
CSR: Small: Leveraging Physical Side-Channels for Good
CSR:小:利用物理侧通道做好事
  • 批准号:
    2312089
  • 财政年份:
    2024
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
CSR: Small: Multi-FPGA System for Real-time Fraud Detection with Large-scale Dynamic Graphs
CSR:小型:利用大规模动态图进行实时欺诈检测的多 FPGA 系统
  • 批准号:
    2317251
  • 财政年份:
    2024
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
AF: Small: Problems in Algorithmic Game Theory for Online Markets
AF:小:在线市场的算法博弈论问题
  • 批准号:
    2332922
  • 财政年份:
    2024
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Small: Algorithmic Self-Assembly with Crisscross Slats
合作研究:FET:小型:十字交叉板条的算法自组装
  • 批准号:
    2329908
  • 财政年份:
    2024
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
NeTS: Small: ML-Driven Online Traffic Analysis at Multi-Terabit Line Rates
NeTS:小型:ML 驱动的多太比特线路速率在线流量分析
  • 批准号:
    2331111
  • 财政年份:
    2024
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了