SHF: Small: Collaborative Research: Modeling and Analyzing Big Data on Peta- and Exascale Distributed Systems Supported by MapReduce Methodologies

SHF:小型:协作研究:在 MapReduce 方法支持下对 Peta 和 Exascale 分布式系统上的大数据进行建模和分析

基本信息

  • 批准号:
    1318417
  • 负责人:
  • 金额:
    $ 6.9万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2013
  • 资助国家:
    美国
  • 起止时间:
    2013-09-01 至 2017-08-31
  • 项目状态:
    已结题

项目摘要

Current petascale platforms can perform large-scale simulations and generate massive amounts of data at unprecedented rates. These rates are expected to increase as exascale platforms are introduced. The generation of more and more data presents new challenges for scientists who struggle with the analysis, sorting, and selection of scientifically meaningful results. When very large amounts of data records are located across a large number of nodes in a distributed memory system, even a small number of comparisons can be costly or even impossible. Therefore, new methodologies are necessary to analyze large scientific datasets at scale.The goal of this project is to develop a transformative analysis method to model the properties of large scientific datasets in a distributed manner on petascale systems today and exascale systems in the future. The research activity includes (1) the design of new algorithms for encoding properties embedded in distributed data in a parallel manner by using space reduction techniques; (2) the design of new algorithms for clustering and classifying these properties by using distributed paradigms such as MapReduce; (3) the deployment of the algorithms for diverse datasets in structural biology and astronomy; and (4) the tuning of the algorithms for both result performance and accuracy on emerging storage technologies. The analysis method will provide the scientific community with infrastructures and instrumentations to identify features that can be used to predict class memberships; find recurrent patterns in datasets; and identify class memberships from a specific feature or property. By effectively and accurately capturing scientific information in a scalable manner, these infrastructures and instrumentations will break the traditional constraint of data centralization and allow scientists to overcome the difficulties associated with the fully distributed nature of the data considered.The project's educational component promotes training and learning in computational modeling and analysis techniques as well as data-intensive algorithms and platforms by involving undergraduate and graduate students in research activities and integrating big data analytics into the undergraduate curriculum at the University of Delaware. The research-based educational materials developed in this project will be made available to the scientific community through the project portal and through tutorials at XSEDE and Supercomputing (SC) conferences.
当前的千万级平台可以执行大规模模拟并以前所未有的速度生成大量数据。随着百亿亿级平台的推出,这些速率预计将会增加。越来越多的数据的产生给那些努力分析、排序和选择具有科学意义的结果的科学家带来了新的挑战。当大量数据记录分布在分布式内存系统中的大量节点上时,即使是少量的比较也可能代价高昂甚至不可能。因此,需要新的方法来大规模分析大型科学数据集。该项目的目标是开发一种变革性分析方法,以分布式方式在当今的千万级系统和未来的百亿亿级系统上对大型科学数据集的属性进行建模。研究活动包括(1)设计新算法,利用空间缩减技术以并行方式对嵌入分布式数据的属性进行编码; (2)使用MapReduce等分布式范式设计对这些属性进行聚类和分类的新算法; (3) 结构生物学和天文学中不同数据集的算法部署; (4) 针对新兴存储技术的结果性能和准确性调整算法。该分析方法将为科学界提供基础设施和仪器来识别可用于预测类别成员资格的特征;查找数据集中的重复模式;并根据特定功能或属性识别类成员资格。通过以可扩展的方式有效、准确地捕获科学信息,这些基础设施和仪器将打破数据集中的传统约束,使科学家能够克服与所考虑的数据的完全分布式性质相关的困难。该项目的教育部分通过让本科生和研究生参与研究活动并将大数据分析集成到计算模型和分析技术以及数据密集型算法和平台方面促进培训和学习。 特拉华大学的本科课程。该项目开发的基于研究的教育材料将通过项目门户以及 XSEDE 和超级计算 (SC) 会议上的教程向科学界提供。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Pietro Cicotti其他文献

Toward application-specific memory reconfiguration for energy efficiency
针对特定应用的内存重新配置以提高能效
  • DOI:
    10.1145/2536430.2536434
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Pietro Cicotti;L. Carrington;A. Chien
  • 通讯作者:
    A. Chien
Automatic translation of MPI source into a latency-tolerant, data-driven form
  • DOI:
    10.1016/j.jpdc.2017.02.009
  • 发表时间:
    2017-08-01
  • 期刊:
  • 影响因子:
  • 作者:
    Tan Nguyen;Pietro Cicotti;Eric Bylaska;Dan Quinlan;Scott Baden
  • 通讯作者:
    Scott Baden
Enabling In-Situ Data Analysis for Large Protein-Folding Trajectory Datasets
实现大型蛋白质折叠轨迹数据集的原位数据分析
Hardware-assisted Workload Dispatching in Heterogeneous Dataflow Architectures
异构数据流架构中的硬件辅助工作负载调度
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    D. Mu;Pietro Cicotti;Yifeng Cui;En;Po Chen
  • 通讯作者:
    Po Chen
ADAMANT: Tools to Capture, Analyze, and Manage Data Movement
ADAMANT:捕获、分析和管理数据移动的工具

Pietro Cicotti的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Pietro Cicotti', 18)}}的其他基金

EAGER: Advanced DAta Movement ANalysis Toolkit (ADAMANT)
EAGER:高级数据移动分析工具包 (ADAMANT)
  • 批准号:
    1451598
  • 财政年份:
    2014
  • 资助金额:
    $ 6.9万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
  • 批准号:
    2331302
  • 财政年份:
    2024
  • 资助金额:
    $ 6.9万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
  • 批准号:
    2331301
  • 财政年份:
    2024
  • 资助金额:
    $ 6.9万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Efficient and Scalable Privacy-Preserving Neural Network Inference based on Ciphertext-Ciphertext Fully Homomorphic Encryption
合作研究:SHF:小型:基于密文-密文全同态加密的高效、可扩展的隐私保护神经网络推理
  • 批准号:
    2412357
  • 财政年份:
    2024
  • 资助金额:
    $ 6.9万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Quasi Weightless Neural Networks for Energy-Efficient Machine Learning on the Edge
合作研究:SHF:小型:用于边缘节能机器学习的准失重神经网络
  • 批准号:
    2326895
  • 财政年份:
    2023
  • 资助金额:
    $ 6.9万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Enabling Efficient 3D Perception: An Architecture-Algorithm Co-Design Approach
协作研究:SHF:小型:实现高效的 3D 感知:架构-算法协同设计方法
  • 批准号:
    2334624
  • 财政年份:
    2023
  • 资助金额:
    $ 6.9万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Technical Debt Management in Dynamic and Distributed Systems
合作研究:SHF:小型:动态和分布式系统中的技术债务管理
  • 批准号:
    2232720
  • 财政年份:
    2023
  • 资助金额:
    $ 6.9万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Sub-millisecond Topological Feature Extractor for High-Rate Machine Learning
合作研究:SHF:小型:用于高速机器学习的亚毫秒拓扑特征提取器
  • 批准号:
    2234921
  • 财政年份:
    2023
  • 资助金额:
    $ 6.9万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Reimagining Communication Bottlenecks in GNN Acceleration through Collaborative Locality Enhancement and Compression Co-Design
协作研究:SHF:小型:通过协作局部性增强和压缩协同设计重新想象 GNN 加速中的通信瓶颈
  • 批准号:
    2326494
  • 财政年份:
    2023
  • 资助金额:
    $ 6.9万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Quasi Weightless Neural Networks for Energy-Efficient Machine Learning on the Edge
合作研究:SHF:小型:用于边缘节能机器学习的准失重神经网络
  • 批准号:
    2326894
  • 财政年份:
    2023
  • 资助金额:
    $ 6.9万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Sub-millisecond Topological Feature Extractor for High-Rate Machine Learning
合作研究:SHF:小型:用于高速机器学习的亚毫秒拓扑特征提取器
  • 批准号:
    2234920
  • 财政年份:
    2023
  • 资助金额:
    $ 6.9万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了