BIGDATA: IA: Collaborative Research: In Situ Data Analytics for Next Generation Molecular Dynamics Workflows

BIGDATA:IA:协作研究:下一代分子动力学工作流程的原位数据分析

基本信息

  • 批准号:
    1741057
  • 负责人:
  • 金额:
    $ 98万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2017
  • 资助国家:
    美国
  • 起止时间:
    2017-10-01 至 2018-08-31
  • 项目状态:
    已结题

项目摘要

Molecular dynamics simulations studying the classical time evolution of a molecular system at atomic resolution are widely recognized in the fields of chemistry, material sciences, molecular biology and drug design; these simulations are one of the most common simulations on supercomputers. Next-generation supercomputers will have dramatically higher performance than do current systems, generating more data that needs to be analyzed (i.e., in terms of number and length of molecular dynamics trajectories). The coordination of data generation and analysis cannot rely on manual, centralized approaches as it does now. This interdisciplinary project integrates research from various areas across programs such as computer science, structural molecular biosciences, and high performance computing to transform the centralized nature of the molecular dynamics analysis into a distributed approach that is predominantly performed in situ. Specifically, this effort combines machine learning and data analytics approaches, workflow management methods, and high performance computing techniques to analyze molecular dynamics data as it is generated, save to disk only what is really needed for future analysis, and annotate molecular dynamics trajectories to drive the next steps in increasingly complex simulations' workflows. The investigators tackle the data challenge of data analysis of molecular dynamics simulations on the next-generation supercomputers by (1) creating new in situ methods to trace molecular events such as conformational changes, phase transitions, or binding events in molecular dynamics simulations at runtime by locally reducing knowledge on high-dimensional molecular organization into a set of relevant structural molecular properties; (2) designing new data representations and extend unsupervised machine learning techniques to accurately and efficiently build an explicit global organization of structural and temporal molecular properties; (3) integrating simulation and analytics into complex workflows for runtime detection of changes in structural and temporal molecular properties; and (4) developing new curriculum material, online courses, and online training material targeting data analytics. The project's harnessed knowledge of molecular structures' transformations at runtime can be used to steer simulations to more promising areas of the simulation space, identify the data that should be written to congested parallel file systems, and index generated data for retrieval and post-simulation analysis. Supported by this knowledge, molecular dynamics workflows such as replica exchange simulations, Markov state models, and the string method with swarms of trajectories can be executed ?from the outside? (i.e., without reengineering the molecular dynamics code).
在原子分辨率下研究分子系统经典时间演化的分子动力学模拟在化学、材料科学、分子生物学和药物设计等领域得到广泛认可;这些模拟是超级计算机上最常见的模拟之一。下一代超级计算机的性能将大大高于现有系统,产生更多需要分析的数据(即分子动力学轨迹的数量和长度)。数据生成和分析的协调不能像现在这样依赖于手动的、集中的方法。这个跨学科项目整合了来自不同领域的研究,如计算机科学、结构分子生物科学和高性能计算,将分子动力学分析的集中性质转变为主要在原位执行的分布式方法。具体来说,这项工作结合了机器学习和数据分析方法、工作流管理方法和高性能计算技术,在生成分子动力学数据时分析分子动力学数据,仅将未来分析真正需要的数据保存到磁盘,并注释分子动力学轨迹,以推动日益复杂的模拟工作流程的下一步。研究人员通过以下方式解决了下一代超级计算机上分子动力学模拟数据分析的数据挑战:(1)创建了新的原位方法,通过局部将高维分子组织的知识简化为一组相关的结构分子性质,来跟踪分子动力学模拟中的构象变化、相变或结合事件等分子事件;(2)设计新的数据表示和扩展无监督机器学习技术,以准确有效地建立结构和时间分子性质的明确全局组织;(3)将模拟和分析集成到复杂的工作流程中,用于运行时检测结构和时间分子性质的变化;(4)开发针对数据分析的新课程材料、在线课程和在线培训材料。该项目利用了运行时分子结构转换的知识,可用于将模拟引导到模拟空间中更有前途的领域,识别应该写入拥挤的并行文件系统的数据,并为检索和模拟后分析索引生成的数据。在这些知识的支持下,分子动力学工作流程,如复制交换模拟、马尔可夫状态模型和具有轨迹群的字符串方法可以执行。从外面?(即,无需重新设计分子动力学代码)。

项目成果

期刊论文数量(16)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Studying Latency and Throughput Constraints for Geo-Distributed Data in the National Science Data Fabric
研究国家科学数据结构中地理分布式数据的延迟和吞吐量约束
Adaptive Sampling using a Geometric Brownian Motion Model to Predict MD Trajectory Mobility on a Free Energy Surface
使用几何布朗运动模型的自适应采样来预测自由能表面上的 MD 轨迹迁移率
  • DOI:
    10.1016/j.bpj.2020.11.690
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    3.4
  • 作者:
    Kots, Ekaterina D.;Shore, Derek M.;Weinstein, Harel
  • 通讯作者:
    Weinstein, Harel
Composable Workflow for Accelerating Neural Architecture Search Using In Situ Analytics for Protein Classification
  • DOI:
    10.1145/3605573.3605636
  • 发表时间:
    2023-08
  • 期刊:
  • 影响因子:
    0
  • 作者:
    G. Channing;Ria Patel;Paula Olaya;A. Rorabaugh;Osamu Miyashita;Silvina Caíno-Lores;Catherine Schuman;F. Tama;Michela Taufer
  • 通讯作者:
    G. Channing;Ria Patel;Paula Olaya;A. Rorabaugh;Osamu Miyashita;Silvina Caíno-Lores;Catherine Schuman;F. Tama;Michela Taufer
A Novel Metric to Evaluate In Situ Workflows
  • DOI:
    10.1007/978-3-030-50371-0_40
  • 发表时间:
    2020-05-26
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Do TM;Pottier L;Thomas S;da Silva RF;Cuendet MA;Weinstein H;Estrada T;Taufer M;Deelman E
  • 通讯作者:
    Deelman E
VINARCH: A Visual Analytics Interactive Tool for Neural Network Archaeology
VInarch:神经网络考古学的可视化分析交互式工具
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Michela Taufer其他文献

Enhancing Scientific Research with FAIR Digital Objects in the National Science Data Fabric
利用国家科学数据结构中的 FAIR 数字对象加强科学研究
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Michela Taufer;Heberth Martinez;Jakob Luettgau;Lauren Whitnah;G. Scorzelli;P. Newell;Aashish Panta;P. Bremer;Douglas Fils;Christine R. Kirkpatrick;V. Pascucci;Kathryn Mohror;J. Shalf
  • 通讯作者:
    J. Shalf
Integrating FAIR Digital Objects (FDOs) into the National Science Data Fabric (NSDF) to Revolutionize Dataflows for Scientific Discovery
将 FAIR 数字对象 (FDO) 集成到国家科学数据结构 (NSDF) 中,彻底改变科学发现的数据流
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Michela Taufer;Heberth Martinez;Jakob Luettgau;Lauren Whitnah;†. GiorgioScorzelli;†. PaniaNewel;Aashish Panta;Timo Bremer;§. DougFils;¶. ChristineR.Kirkpatrick;Nina McCurdy;V. Pascucci;U. Knoxville;†. U.Utah;R. LLNL ‡;Research Center
  • 通讯作者:
    Research Center

Michela Taufer的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Michela Taufer', 18)}}的其他基金

EAGER: A Comprehensive Approach for Generating, Sharing, Searching, and Using High-Resolution Terrain Parameters
EAGER:生成、共享、搜索和使用高分辨率地形参数的综合方法
  • 批准号:
    2334945
  • 财政年份:
    2023
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Model-driven Design and Optimization of Dataflows for Scientific Applications
协作研究:SHF:小型:科学应用数据流的模型驱动设计和优化
  • 批准号:
    2331152
  • 财政年份:
    2023
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
SHF: Small: Methods, Workflows, and Data Commons for Reducing Training Costs in Neural Architecture Search on High-Performance Computing Platforms
SHF:小型:降低高性能计算平台上神经架构搜索训练成本的方法、工作流程和数据共享
  • 批准号:
    2223704
  • 财政年份:
    2022
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
Collaborative Research: Elements: SENSORY: Software Ecosystem for kNowledge diScOveRY - a data-driven framework for soil moisture applications
协作研究:要素:SENSORY:知识发现的软件生态系统 - 土壤湿度应用的数据驱动框架
  • 批准号:
    2103845
  • 财政年份:
    2021
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
Collaborative Research: PPoSS: Planning: Performance Scalability, Trust, and Reproducibility: A Community Roadmap to Robust Science in High-throughput Applications
协作研究:PPoSS:规划:性能可扩展性、信任和可重复性:高通量应用中稳健科学的社区路线图
  • 批准号:
    2028923
  • 财政年份:
    2020
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
Collaborative Research: EAGER: Advancing Reproducibility in Multi-Messenger Astrophysics
合作研究:EAGER:提高多信使天体物理学的可重复性
  • 批准号:
    2041977
  • 财政年份:
    2020
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
SHF: Medium: Collaborative Research: ANACIN-X: Analysis and modeling of Nondeterminism and Associated Costs in eXtreme scale applications
SHF:中:协作研究:ANACIN-X:极端规模应用中的非确定性和相关成本的分析和建模
  • 批准号:
    1900888
  • 财政年份:
    2019
  • 资助金额:
    $ 98万
  • 项目类别:
    Continuing Grant
Collaborative: EAGER: Exploring and Advancing the State of the Art in Robust Science in Gravitational Wave Physics
合作:EAGER:探索和推进引力波物理学稳健科学的最新技术
  • 批准号:
    1841399
  • 财政年份:
    2018
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
Collaborative: EAGER: Exploring and Advancing the State of the Art in Robust Science in Gravitational Wave Physics
合作:EAGER:探索和推进引力波物理学稳健科学的最新技术
  • 批准号:
    1823372
  • 财政年份:
    2018
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
SHF:Medium:Collaborative Research:A comprehensive methodology to pursue reproducible accuracy in ensemble scientific simulations on multi- and many-core platforms
SHF:中:协作研究:在多核和众核平台上追求集合科学模拟的可重复精度的综合方法
  • 批准号:
    1841552
  • 财政年份:
    2018
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant

相似国自然基金

多任务深度学习融合多模态数据术前精准预测IA期非小细胞肺癌亚肺叶切除术复发风险
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
Ia型超新星多波段实测特性及其机理研究
  • 批准号:
    JCZRYB202500270
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
Ia型超新星及相关特殊天体研究
  • 批准号:
    12333008
  • 批准年份:
    2023
  • 资助金额:
    239.00 万元
  • 项目类别:
    重点项目
南方根结线虫Mi-UNP与Bt-Cry1Ia36互作研究及其功能分析
  • 批准号:
    2023JJ30355
  • 批准年份:
    2023
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
胞苷脱氨酶调控南方根结线虫响应Bt-Cry1Ia 胁迫的机制研究
  • 批准号:
    2022JJ40235
  • 批准年份:
    2022
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
甘蓝型油菜BnaA01.IA调控花序结构的分子机制解析
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
年轻Ia型超新星遗迹在湍动背景场中的数值模拟研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
Ia型超新星抛射物元素丰度与时域观测特征相关性研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
miR-23a~27a簇介导DNMT调控PD-L1和HLA-Ia表达促进早期肺腺癌复发的机制研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
大豆GmCPSF73-Ia调控侧根发育的分子机制
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    58 万元
  • 项目类别:
    面上项目

相似海外基金

BIGDATA: IA: Collaborative Research: Asynchronous Distributed Machine Learning Framework for Multi-Site Collaborative Brain Big Data Mining
BIGDATA:IA:协作研究:用于多站点协作大脑大数据挖掘的异步分布式机器学习框架
  • 批准号:
    2348159
  • 财政年份:
    2023
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
BIGDATA: IA: Collaborative Research: Intelligent Solutions for Navigating Big Data from the Arctic and Antarctic
BIGDATA:IA:协作研究:导航北极和南极大数据的智能解决方案
  • 批准号:
    2308649
  • 财政年份:
    2022
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
BIGDATA: IA: Collaborative Research: Protecting Yourself from Wildfire Smoke: Big Data-Driven Adaptive Air Quality Prediction Methodologies
大数据:IA:协作研究:保护自己免受野火烟雾的侵害:大数据驱动的自适应空气质量预测方法
  • 批准号:
    1838022
  • 财政年份:
    2019
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
BIGDATA: IA: Collaborative Research: Intelligent Solutions for Navigating Big Data from the Arctic and Antarctic
BIGDATA:IA:协作研究:导航北极和南极大数据的智能解决方案
  • 批准号:
    1947584
  • 财政年份:
    2019
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
BIGDATA: IA: Collaborative Research: Asynchronous Distributed Machine Learning Framework for Multi-Site Collaborative Brain Big Data Mining
BIGDATA:IA:协作研究:用于多站点协作大脑大数据挖掘的异步分布式机器学习框架
  • 批准号:
    1837964
  • 财政年份:
    2019
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
BIGDATA: IA: Collaborative Research: Asynchronous Distributed Machine Learning Framework for Multi-Site Collaborative Brain Big Data Mining
BIGDATA:IA:协作研究:用于多站点协作大脑大数据挖掘的异步分布式机器学习框架
  • 批准号:
    1837956
  • 财政年份:
    2019
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
BIGDATA: IA: Collaborative Research: Protecting Yourself from Wildfire Smoke: Big Data Driven Adaptive Air Quality Prediction Methodologies
大数据:IA:协作研究:保护自己免受野火烟雾的侵害:大数据驱动的自适应空气质量预测方法
  • 批准号:
    1838024
  • 财政年份:
    2019
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
BIGDATA: IA: Collaborative Research: Asynchronous Distributed Machine Learning Framework for Multi-Site Collaborative Brain Big Data Mining
BIGDATA:IA:协作研究:用于多站点协作大脑大数据挖掘的异步分布式机器学习框架
  • 批准号:
    1837999
  • 财政年份:
    2019
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
BIGDATA: IA: Collaborative Research: Domain Adaptation Approaches for Classifying Crisis Related Data on Social Media
大数据:IA:协作研究:社交媒体上危机相关数据分类的领域适应方法
  • 批准号:
    1741370
  • 财政年份:
    2018
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
BIGDATA: IA: Collaborative Research: Data-Driven, Multi-Scale Design of Liquid Crystals for Wearable Sensors for Monitoring Human Exposure and Air Quality
大数据:IA:协作研究:用于监测人体暴露和空气质量的可穿戴传感器的数据驱动、多尺度液晶设计
  • 批准号:
    1837821
  • 财政年份:
    2018
  • 资助金额:
    $ 98万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了