BIGDATA: IA: Collaborative Research: In Situ Data Analytics for Next Generation Molecular Dynamics Workflows

BIGDATA:IA:协作研究:下一代分子动力学工作流程的原位数据分析

基本信息

项目摘要

Molecular dynamics simulations studying the classical time evolution of a molecular system at atomic resolution are widely recognized in the fields of chemistry, material sciences, molecular biology and drug design; these simulations are one of the most common simulations on supercomputers. Next-generation supercomputers will have dramatically higher performance than do current systems, generating more data that needs to be analyzed (i.e., in terms of number and length of molecular dynamics trajectories). The coordination of data generation and analysis cannot rely on manual, centralized approaches as it does now. This interdisciplinary project integrates research from various areas across programs such as computer science, structural molecular biosciences, and high performance computing to transform the centralized nature of the molecular dynamics analysis into a distributed approach that is predominantly performed in situ. Specifically, this effort combines machine learning and data analytics approaches, workflow management methods, and high performance computing techniques to analyze molecular dynamics data as it is generated, save to disk only what is really needed for future analysis, and annotate molecular dynamics trajectories to drive the next steps in increasingly complex simulations' workflows. The investigators tackle the data challenge of data analysis of molecular dynamics simulations on the next-generation supercomputers by (1) creating new in situ methods to trace molecular events such as conformational changes, phase transitions, or binding events in molecular dynamics simulations at runtime by locally reducing knowledge on high-dimensional molecular organization into a set of relevant structural molecular properties; (2) designing new data representations and extend unsupervised machine learning techniques to accurately and efficiently build an explicit global organization of structural and temporal molecular properties; (3) integrating simulation and analytics into complex workflows for runtime detection of changes in structural and temporal molecular properties; and (4) developing new curriculum material, online courses, and online training material targeting data analytics. The project's harnessed knowledge of molecular structures' transformations at runtime can be used to steer simulations to more promising areas of the simulation space, identify the data that should be written to congested parallel file systems, and index generated data for retrieval and post-simulation analysis. Supported by this knowledge, molecular dynamics workflows such as replica exchange simulations, Markov state models, and the string method with swarms of trajectories can be executed ?from the outside? (i.e., without reengineering the molecular dynamics code).
在原子分辨率下研究分子系统经典时间演化的分子动力学模拟在化学、材料科学、分子生物学和药物设计等领域得到广泛认可;这些模拟是超级计算机上最常见的模拟之一。下一代超级计算机的性能将大大高于现有系统,产生更多需要分析的数据(即分子动力学轨迹的数量和长度)。数据生成和分析的协调不能像现在这样依赖于手动的、集中的方法。这个跨学科项目整合了来自不同领域的研究,如计算机科学、结构分子生物科学和高性能计算,将分子动力学分析的集中性质转变为主要在原位执行的分布式方法。具体来说,这项工作结合了机器学习和数据分析方法、工作流管理方法和高性能计算技术,在生成分子动力学数据时分析分子动力学数据,仅将未来分析真正需要的数据保存到磁盘,并注释分子动力学轨迹,以推动日益复杂的模拟工作流程的下一步。研究人员通过以下方式解决了下一代超级计算机上分子动力学模拟数据分析的数据挑战:(1)创建了新的原位方法,通过局部将高维分子组织的知识简化为一组相关的结构分子性质,来跟踪分子动力学模拟中的构象变化、相变或结合事件等分子事件;(2)设计新的数据表示和扩展无监督机器学习技术,以准确有效地建立结构和时间分子性质的明确全局组织;(3)将模拟和分析集成到复杂的工作流程中,用于运行时检测结构和时间分子性质的变化;(4)开发针对数据分析的新课程材料、在线课程和在线培训材料。该项目利用了运行时分子结构转换的知识,可用于将模拟引导到模拟空间中更有前途的领域,识别应该写入拥挤的并行文件系统的数据,并为检索和模拟后分析索引生成的数据。在这些知识的支持下,分子动力学工作流程,如复制交换模拟、马尔可夫状态模型和具有轨迹群的字符串方法可以执行。从外面?(即,无需重新设计分子动力学代码)。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Graphic Encoding of Macromolecules for Efficient High-Throughput Analysis
A Machine Learning Approach for the Discovery of Ligand-Specific Functional Mechanisms of GPCRs
  • DOI:
    10.3390/molecules24112097
  • 发表时间:
    2019-06-01
  • 期刊:
  • 影响因子:
    4.6
  • 作者:
    Plante, Ambrose;Shore, Derek M.;Weinstein, Harel
  • 通讯作者:
    Weinstein, Harel
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Harel Weinstein其他文献

Modeling Orientation-Constrained Reactions: A Study Of Crowding Effects With Brownian Dynamics Simulation
  • DOI:
    10.1016/j.bpj.2008.12.343
  • 发表时间:
    2009-02-01
  • 期刊:
  • 影响因子:
  • 作者:
    Jian Sun;Harel Weinstein
  • 通讯作者:
    Harel Weinstein
The Substrate Translocation Pathway and Transport Mechanism in the Dopamine Transporter
  • DOI:
    10.1016/j.bpj.2008.12.3171
  • 发表时间:
    2009-02-01
  • 期刊:
  • 影响因子:
  • 作者:
    Jufang Shan;Yvette Dehnes;Javitch A. Jonathan;Lei Shi;Harel Weinstein
  • 通讯作者:
    Harel Weinstein
A misconception concerning the electronic density distribution of an atom
  • DOI:
    10.1007/bf00581473
  • 发表时间:
    1975-06-01
  • 期刊:
  • 影响因子:
    1.500
  • 作者:
    Harel Weinstein;Peter Politzer;Shalom Srebrenik
  • 通讯作者:
    Shalom Srebrenik
"Specific binding" of 3H-phencyclidine: artifacts of the rapid filtration method.
3H-苯环己哌啶的“特异性结合”:快速过滤方法的伪影。
  • DOI:
  • 发表时间:
    1980
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Saul Maayani;Harel Weinstein
  • 通讯作者:
    Harel Weinstein
Adsorption Of Bar-domain Proteins To Charged Lipid Membranes Causes Deformations And Lipid Demixing
  • DOI:
    10.1016/j.bpj.2008.12.401
  • 发表时间:
    2009-02-01
  • 期刊:
  • 影响因子:
  • 作者:
    George Khelashvili;Daniel Harries;Harel Weinstein
  • 通讯作者:
    Harel Weinstein

Harel Weinstein的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Harel Weinstein', 18)}}的其他基金

Molecular Mechanisms in Histamine H2-Receptor Pharmacology
组胺 H2 受体药理学的分子机制
  • 批准号:
    8303373
  • 财政年份:
    1983
  • 资助金额:
    $ 49.71万
  • 项目类别:
    Continuing Grant

相似国自然基金

多任务深度学习融合多模态数据术前精准预测IA期非小细胞肺癌亚肺叶切除术复发风险
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
Ia型超新星多波段实测特性及其机理研究
  • 批准号:
    JCZRYB202500270
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
Ia型超新星及相关特殊天体研究
  • 批准号:
    12333008
  • 批准年份:
    2023
  • 资助金额:
    239.00 万元
  • 项目类别:
    重点项目
南方根结线虫Mi-UNP与Bt-Cry1Ia36互作研究及其功能分析
  • 批准号:
    2023JJ30355
  • 批准年份:
    2023
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
胞苷脱氨酶调控南方根结线虫响应Bt-Cry1Ia 胁迫的机制研究
  • 批准号:
    2022JJ40235
  • 批准年份:
    2022
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
甘蓝型油菜BnaA01.IA调控花序结构的分子机制解析
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
年轻Ia型超新星遗迹在湍动背景场中的数值模拟研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
Ia型超新星抛射物元素丰度与时域观测特征相关性研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
miR-23a~27a簇介导DNMT调控PD-L1和HLA-Ia表达促进早期肺腺癌复发的机制研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
大豆GmCPSF73-Ia调控侧根发育的分子机制
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    58 万元
  • 项目类别:
    面上项目

相似海外基金

BIGDATA: IA: Collaborative Research: Asynchronous Distributed Machine Learning Framework for Multi-Site Collaborative Brain Big Data Mining
BIGDATA:IA:协作研究:用于多站点协作大脑大数据挖掘的异步分布式机器学习框架
  • 批准号:
    2348159
  • 财政年份:
    2023
  • 资助金额:
    $ 49.71万
  • 项目类别:
    Standard Grant
BIGDATA: IA: Collaborative Research: Intelligent Solutions for Navigating Big Data from the Arctic and Antarctic
BIGDATA:IA:协作研究:导航北极和南极大数据的智能解决方案
  • 批准号:
    2308649
  • 财政年份:
    2022
  • 资助金额:
    $ 49.71万
  • 项目类别:
    Standard Grant
BIGDATA: IA: Collaborative Research: Protecting Yourself from Wildfire Smoke: Big Data-Driven Adaptive Air Quality Prediction Methodologies
大数据:IA:协作研究:保护自己免受野火烟雾的侵害:大数据驱动的自适应空气质量预测方法
  • 批准号:
    1838022
  • 财政年份:
    2019
  • 资助金额:
    $ 49.71万
  • 项目类别:
    Standard Grant
BIGDATA: IA: Collaborative Research: Intelligent Solutions for Navigating Big Data from the Arctic and Antarctic
BIGDATA:IA:协作研究:导航北极和南极大数据的智能解决方案
  • 批准号:
    1947584
  • 财政年份:
    2019
  • 资助金额:
    $ 49.71万
  • 项目类别:
    Standard Grant
BIGDATA: IA: Collaborative Research: Asynchronous Distributed Machine Learning Framework for Multi-Site Collaborative Brain Big Data Mining
BIGDATA:IA:协作研究:用于多站点协作大脑大数据挖掘的异步分布式机器学习框架
  • 批准号:
    1837964
  • 财政年份:
    2019
  • 资助金额:
    $ 49.71万
  • 项目类别:
    Standard Grant
BIGDATA: IA: Collaborative Research: Asynchronous Distributed Machine Learning Framework for Multi-Site Collaborative Brain Big Data Mining
BIGDATA:IA:协作研究:用于多站点协作大脑大数据挖掘的异步分布式机器学习框架
  • 批准号:
    1837956
  • 财政年份:
    2019
  • 资助金额:
    $ 49.71万
  • 项目类别:
    Standard Grant
BIGDATA: IA: Collaborative Research: Protecting Yourself from Wildfire Smoke: Big Data Driven Adaptive Air Quality Prediction Methodologies
大数据:IA:协作研究:保护自己免受野火烟雾的侵害:大数据驱动的自适应空气质量预测方法
  • 批准号:
    1838024
  • 财政年份:
    2019
  • 资助金额:
    $ 49.71万
  • 项目类别:
    Standard Grant
BIGDATA: IA: Collaborative Research: Asynchronous Distributed Machine Learning Framework for Multi-Site Collaborative Brain Big Data Mining
BIGDATA:IA:协作研究:用于多站点协作大脑大数据挖掘的异步分布式机器学习框架
  • 批准号:
    1837999
  • 财政年份:
    2019
  • 资助金额:
    $ 49.71万
  • 项目类别:
    Standard Grant
BIGDATA: IA: Collaborative Research: Domain Adaptation Approaches for Classifying Crisis Related Data on Social Media
大数据:IA:协作研究:社交媒体上危机相关数据分类的领域适应方法
  • 批准号:
    1741370
  • 财政年份:
    2018
  • 资助金额:
    $ 49.71万
  • 项目类别:
    Standard Grant
BIGDATA: IA: Collaborative Research: Data-Driven, Multi-Scale Design of Liquid Crystals for Wearable Sensors for Monitoring Human Exposure and Air Quality
大数据:IA:协作研究:用于监测人体暴露和空气质量的可穿戴传感器的数据驱动、多尺度液晶设计
  • 批准号:
    1837821
  • 财政年份:
    2018
  • 资助金额:
    $ 49.71万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了