SciDAP: Scientific Data Analysis Platform

SciDAP:科学数据分析平台

基本信息

  • 批准号:
    10622562
  • 负责人:
  • 金额:
    $ 77.96万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2020
  • 资助国家:
    美国
  • 起止时间:
    2020-09-14 至 2025-05-31
  • 项目状态:
    未结题

项目摘要

The recent proliferation of next-generation sequencing (NGS) - based methods for the analysis of expression, chromatin and protein-DNA interactions has created tremendous opportunities for gaining insights into biology, health, and disease. However, analysis of the data requires computational expertise that many biologists do not possess. Hence, when dealing with genomics data, majority of biologists require the help of bioinformaticians even for simple tasks. This places these exciting methods beyond the reach of the majority of life scientists. This phase II proposal from DATIRIUM, LLC, a start-up from Cincinnati, OH follows phase I project that resulted in the development of a prototype (MVP) of SciDAP (Scientific Data Analysis Platform), a novel multi- omics user-friendly data analysis platform that allows biologists to analyze the data and enables collaboration with bioinformaticians. The current phase II proposal describes a plan to continue SciDAP development. The key problem for creating user-friendly data analysis packages is the difficulty in adding new or modifying existing pipelines: due to the tight coupling between pipeline and user interface this required changes at all levels of software. Unfortunately, the same limitation exists for all user-friendly bioinformatics tools. Given that there are more than 150 NGS-based methods and many ways to process the data, this explains why a universal and user-friendly data analysis platform does not yet exist. We hypothesized that we can create a data analysis platform that is both universal and user-friendly by including interface instructions into computational pipelines. Platform will use these instructions to create a graphical interface. Specifically, we are using containerized pipelines developed using Common Workflow Language (CWL) making our pipelines both portable and reproducible. On top of CWL, Datirium developed a system of CWL extensions that allows to describe the inputs and outputs visualizations within the CWL workflows. Importantly, our platform will increase the rigor of computational analysis by (i) making the analysis reproducible and auditable by bioinformaticians due to CWL pipeline portability and recording each step of the analysis as Research Objects; (ii) enabling collaboration between experimentalists and computational biologists by providing bioinformaticians with a way to direct analysis flow and biologists with the convenience of GUI; (iii) Including out of the box pipelines with optimized parameters and actionable QC metrics that flag possible issues. In the first aim of this proposal we will develop a version of SciDAP for use on academic clusters and commercial clouds. In the second aim, in collaboration with Dr. Salomonis at CCHMC, we will adopt pipelines miRNA, WGS/WXS and scMultiome data analysis. In the third, we will develop improvements to SciDAP interface that will increase SciDAP flexibility and usability for bioinformaticians and experimentalists. Successful completion of this project will provide the research community with a cutting edge, flexible and biologist-friendly data analysis platform.
基于下一代测序(NGS)的表达分析方法的最近激增, 染色质和蛋白质-DNA相互作用为深入了解生物学创造了巨大的机会, 健康和疾病。然而,数据分析需要计算专业知识,而许多生物学家并不具备这些知识。 拥有.因此,在处理基因组数据时,大多数生物学家需要生物信息学家的帮助 即使是简单的任务。这使得这些令人兴奋的方法超出了大多数生命科学家的范围。 来自俄亥俄州辛辛那提的一家初创企业DATIRIUM,LLC的第二阶段提案遵循第一阶段项目, 导致了SciDAP(科学数据分析平台)原型(MVP)的开发,这是一种新型的多功能 omics用户友好的数据分析平台,允许生物学家分析数据并实现协作 生物信息学家。目前的第二阶段提案描述了继续SciDAP开发的计划。 创建用户友好的数据分析包的关键问题是添加新的或修改的困难 现有管道:由于管道和用户界面之间的紧密耦合,这需要在所有级别进行更改 的软件。不幸的是,所有用户友好的生物信息学工具都存在同样的限制。鉴于 有超过150个基于NGS的方法和许多方法来处理数据,这解释了为什么一个通用的, 用户友好的数据分析平台尚不存在。 我们假设,我们可以创建一个通用且用户友好的数据分析平台, 将接口指令包括到计算流水线中。平台将使用这些说明创建一个 图形界面具体来说,我们使用的是使用通用工作流开发的容器化管道 语言(CWL)使我们的管道既可移植又可复制。在CWL之上,Datirium开发了一种 一种CWL扩展系统,允许在CWL中描述输入和输出可视化 工作流程。重要的是,我们的平台将通过以下方式提高计算分析的严谨性:(i)使分析 由于CWL管道的可移植性和记录的每一步, 分析作为研究对象;(ii)使实验学家和计算生物学家之间的合作成为可能 通过为生物信息学家提供一种直接分析流程的方法,并为生物学家提供GUI的便利;(iii) 包括开箱即用的管道,具有优化的参数和可操作的QC指标,可标记可能的问题。 在本提案的第一个目标中,我们将开发一个用于学术集群的SciDAP版本, 商业云在第二个目标中,我们将与CCHMC的Salomonis博士合作, miRNA、WGS/WXS和scMultiome数据分析。第三,我们将改进SciDAP 这将为生物信息学家和实验学家增加SciDAP的灵活性和可用性。 该项目的成功完成将为研究界提供一个先进的,灵活的, 生物学家友好的数据分析平台。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Artem Barski其他文献

Artem Barski的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Artem Barski', 18)}}的其他基金

Epigenetic mechanisms of disrupted neurodevelopment in Menke-Hennekam syndrome
Menke-Hennekam 综合征神经发育障碍的表观遗传机制
  • 批准号:
    10816703
  • 财政年份:
    2023
  • 资助金额:
    $ 77.96万
  • 项目类别:
An experimentally-refined, dynamic gene regulatory network model of T-cell memory
经过实验改进的 T 细胞记忆动态基因调控网络模型
  • 批准号:
    10576265
  • 财政年份:
    2021
  • 资助金额:
    $ 77.96万
  • 项目类别:
An experimentally-refined, dynamic gene regulatory network model of T-cell memory
经过实验改进的 T 细胞记忆动态基因调控网络模型
  • 批准号:
    10210685
  • 财政年份:
    2021
  • 资助金额:
    $ 77.96万
  • 项目类别:
Commercialization of SciDAP, a next generation universal platform for collaborative data analysis
SciDAP 的商业化,下一代协作数据分析通用平台
  • 批准号:
    10338010
  • 财政年份:
    2021
  • 资助金额:
    $ 77.96万
  • 项目类别:
An experimentally-refined, dynamic gene regulatory network model of T-cell memory
经过实验改进的 T 细胞记忆动态基因调控网络模型
  • 批准号:
    10368121
  • 财政年份:
    2021
  • 资助金额:
    $ 77.96万
  • 项目类别:
An experimentally-refined, dynamic gene regulatory network model of T-cell memory
经过实验改进的 T 细胞记忆动态基因调控网络模型
  • 批准号:
    10213550
  • 财政年份:
    2020
  • 资助金额:
    $ 77.96万
  • 项目类别:
Death-Seq, a Method for Genome-wide Identification of Functional Silencer Elements
Death-Seq,一种全基因组识别功能性沉默元件的方法
  • 批准号:
    9979291
  • 财政年份:
    2020
  • 资助金额:
    $ 77.96万
  • 项目类别:
SciDAP: Scientific Data Analysis Platform
SciDAP:科学数据分析平台
  • 批准号:
    10484046
  • 财政年份:
    2020
  • 资助金额:
    $ 77.96万
  • 项目类别:
SciDAP: a next generation universal platform for collaborative data analysis
SciDAP:下一代协作数据分析通用平台
  • 批准号:
    10081764
  • 财政年份:
    2020
  • 资助金额:
    $ 77.96万
  • 项目类别:
Direct Epigenetic Reprogramming of T Cells
T 细胞的直接表观遗传重编程
  • 批准号:
    8955075
  • 财政年份:
    2015
  • 资助金额:
    $ 77.96万
  • 项目类别:

相似海外基金

EXCESS: The role of excess topography and peak ground acceleration on earthquake-preconditioning of landslides
过量:过量地形和峰值地面加速度对滑坡地震预处理的作用
  • 批准号:
    NE/Y000080/1
  • 财政年份:
    2024
  • 资助金额:
    $ 77.96万
  • 项目类别:
    Research Grant
Collaborative Research: FuSe: R3AP: Retunable, Reconfigurable, Racetrack-Memory Acceleration Platform
合作研究:FuSe:R3AP:可重调、可重新配置、赛道内存加速平台
  • 批准号:
    2328975
  • 财政年份:
    2024
  • 资助金额:
    $ 77.96万
  • 项目类别:
    Continuing Grant
SHINE: Origin and Evolution of Compressible Fluctuations in the Solar Wind and Their Role in Solar Wind Heating and Acceleration
SHINE:太阳风可压缩脉动的起源和演化及其在太阳风加热和加速中的作用
  • 批准号:
    2400967
  • 财政年份:
    2024
  • 资助金额:
    $ 77.96万
  • 项目类别:
    Standard Grant
Market Entry Acceleration of the Murb Wind Turbine into Remote Telecoms Power
默布风力涡轮机加速进入远程电信电力市场
  • 批准号:
    10112700
  • 财政年份:
    2024
  • 资助金额:
    $ 77.96万
  • 项目类别:
    Collaborative R&D
Collaborative Research: FuSe: R3AP: Retunable, Reconfigurable, Racetrack-Memory Acceleration Platform
合作研究:FuSe:R3AP:可重调、可重新配置、赛道内存加速平台
  • 批准号:
    2328973
  • 财政年份:
    2024
  • 资助金额:
    $ 77.96万
  • 项目类别:
    Continuing Grant
Collaborative Research: FuSe: R3AP: Retunable, Reconfigurable, Racetrack-Memory Acceleration Platform
合作研究:FuSe:R3AP:可重调、可重新配置、赛道内存加速平台
  • 批准号:
    2328972
  • 财政年份:
    2024
  • 资助金额:
    $ 77.96万
  • 项目类别:
    Continuing Grant
Collaborative Research: FuSe: R3AP: Retunable, Reconfigurable, Racetrack-Memory Acceleration Platform
合作研究:FuSe:R3AP:可重调、可重新配置、赛道内存加速平台
  • 批准号:
    2328974
  • 财政年份:
    2024
  • 资助金额:
    $ 77.96万
  • 项目类别:
    Continuing Grant
Collaborative Research: A new understanding of droplet breakup: hydrodynamic instability under complex acceleration
合作研究:对液滴破碎的新认识:复杂加速下的流体动力学不稳定性
  • 批准号:
    2332916
  • 财政年份:
    2024
  • 资助金额:
    $ 77.96万
  • 项目类别:
    Standard Grant
Collaborative Research: A new understanding of droplet breakup: hydrodynamic instability under complex acceleration
合作研究:对液滴破碎的新认识:复杂加速下的流体动力学不稳定性
  • 批准号:
    2332917
  • 财政年份:
    2024
  • 资助金额:
    $ 77.96万
  • 项目类别:
    Standard Grant
Study of the Particle Acceleration and Transport in PWN through X-ray Spectro-polarimetry and GeV Gamma-ray Observtions
通过 X 射线光谱偏振法和 GeV 伽马射线观测研究 PWN 中的粒子加速和输运
  • 批准号:
    23H01186
  • 财政年份:
    2023
  • 资助金额:
    $ 77.96万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了