SciDAP: Scientific Data Analysis Platform
SciDAP:科学数据分析平台
基本信息
- 批准号:10484046
- 负责人:
- 金额:$ 80.25万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2020
- 资助国家:美国
- 起止时间:2020-09-14 至 2024-05-31
- 项目状态:已结题
- 来源:
- 关键词:ATAC-seqAdoptedBiologyChIP-seqChromatin StructureCodeCollaborationsCommunitiesComputer AnalysisComputer softwareCouplingDNA-Protein InteractionDataData AnalysesData SourcesData StoreDevelopmentDiseaseEnsureEnvironmentGene Expression ProfilingHealthHuman ResourcesIndividualInnovation CorpsInstitutionInstructionInterviewLanguageLearningLifeLinuxMethodsMicroRNAsMutation DetectionOutputPhasePrivatizationProcessPythonsReproducibilityResearchResearch PersonnelRespondentScientistSmall Business Technology Transfer ResearchSomatic MutationSystemTechniquesUnited States National Institutes of HealthUniversitiesVisualizationWorkXCL1 geneanalysis pipelinebasebioinformatics toolbiomedical scientistbisulfite sequencingchromatin proteincommercializationcomputational pipelinescomputerized data processingcostexomeexperimental studyflexibilitygenome browsergenomic datagraphical user interfacehuman diseaseinsightmultiple omicsnext generation sequencingnovelopen sourceportabilityprogramsprototyperesearch and developmentsoftware developmenttooltranscriptome sequencingusabilityuser-friendlyweb interfacewhole genome
项目摘要
The recent proliferation of next-generation sequencing (NGS) - based methods for the analysis of expression,
chromatin and protein-DNA interactions has created tremendous opportunities for gaining insights into biology,
health, and disease. However, analysis of the data requires computational expertise that many biologists do not
possess. Hence, when dealing with genomics data, majority of biologists require the help of bioinformaticians
even for simple tasks. This places these exciting methods beyond the reach of the majority of life scientists.
This phase II proposal from DATIRIUM, LLC, a start-up from Cincinnati, OH follows phase I project that
resulted in the development of a prototype (MVP) of SciDAP (Scientific Data Analysis Platform), a novel multi-
omics user-friendly data analysis platform that allows biologists to analyze the data and enables collaboration
with bioinformaticians. The current phase II proposal describes a plan to continue SciDAP development.
The key problem for creating user-friendly data analysis packages is the difficulty in adding new or modifying
existing pipelines: due to the tight coupling between pipeline and user interface this required changes at all levels
of software. Unfortunately, the same limitation exists for all user-friendly bioinformatics tools. Given that there
are more than 150 NGS-based methods and many ways to process the data, this explains why a universal and
user-friendly data analysis platform does not yet exist.
We hypothesized that we can create a data analysis platform that is both universal and user-friendly by
including interface instructions into computational pipelines. Platform will use these instructions to create a
graphical interface. Specifically, we are using containerized pipelines developed using Common Workflow
Language (CWL) making our pipelines both portable and reproducible. On top of CWL, Datirium developed a
system of CWL extensions that allows to describe the inputs and outputs visualizations within the CWL
workflows. Importantly, our platform will increase the rigor of computational analysis by (i) making the analysis
reproducible and auditable by bioinformaticians due to CWL pipeline portability and recording each step of the
analysis as Research Objects; (ii) enabling collaboration between experimentalists and computational biologists
by providing bioinformaticians with a way to direct analysis flow and biologists with the convenience of GUI; (iii)
Including out of the box pipelines with optimized parameters and actionable QC metrics that flag possible issues.
In the first aim of this proposal we will develop a version of SciDAP for use on academic clusters and
commercial clouds. In the second aim, in collaboration with Dr. Salomonis at CCHMC, we will adopt pipelines
miRNA, WGS/WXS and scMultiome data analysis. In the third, we will develop improvements to SciDAP
interface that will increase SciDAP flexibility and usability for bioinformaticians and experimentalists.
Successful completion of this project will provide the research community with a cutting edge, flexible and
biologist-friendly data analysis platform.
下一代测序(NGS)的最新扩散基于表达分析的方法,
染色质和蛋白质-DNA相互作用为获得生物学的见解带来了巨大的机会,
健康和疾病。但是,对数据的分析需要许多生物学家没有的计算专业知识
具有。因此,在处理基因组学数据时,大多数生物学家都需要生物信息学家的帮助
即使是简单的任务。这将这些令人兴奋的方法超出了大多数生活科学家的影响力。
该阶段的II阶段提案来自Datirium,LLC,俄亥俄州辛辛那提的一家初创公司,遵循第一阶段项目
导致了SCIDAP(科学数据分析平台)的原型(MVP)的发展,这是一种新颖
OMICS用户友好的数据分析平台,允许生物学家分析数据并启用协作
与生物信息学家。当前的II阶段提案描述了继续开发SCIDAP的计划。
创建用户友好的数据分析软件包的关键问题是添加新或修改的困难
现有管道:由于管道和用户界面之间的紧密耦合,此必需的所有级别都会发生变化
软件。不幸的是,所有用户友好的生物信息学工具都存在相同的限制。鉴于那里
是150多种基于NGS的方法以及处理数据的许多方法,这解释了为什么通用和
用户友好的数据分析平台尚不存在。
我们假设我们可以创建一个数据分析平台,该平台既通用又可以用户友好
在计算管道中包括界面说明。平台将使用这些说明来创建
图形接口。具体而言,我们使用的是使用通用工作流开发的容器化管道
语言(CWL)使我们的管道既便携式又可再现。在CWL之上,Datirium开发了
CWL扩展的系统,允许描述CWL中的输入和输出可视化
工作流程。重要的是,我们的平台将通过(i)进行分析来增加计算分析的严格性
由于CWL管道可移植性,生物信息学家可重现和可审核
分析作为研究对象; (ii)实现实验者与计算生物学家之间的合作
通过为生物信息学者提供一种直接分析和生物学家的方式,以方便GUI; (iii)
包括包含优化参数和可行的QC指标的盒子管道,以标记可能的问题。
在本提案的第一个目的中,我们将开发一个版本的SCIDAP,以用于学术群集和
商业云。在第二个目标中,与CCHMC的Salomonis博士合作,我们将采用管道
miRNA,WGS/WXS和SCMULTIOME数据分析。在第三个中,我们将对SCIDAP进行改进
界面将增加生物信息学家和实验家的SCIDAP灵活性和可用性。
该项目的成功完成将为研究社区提供尖端,灵活和
生物学家友好的数据分析平台。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Artem Barski其他文献
Artem Barski的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Artem Barski', 18)}}的其他基金
Epigenetic mechanisms of disrupted neurodevelopment in Menke-Hennekam syndrome
Menke-Hennekam 综合征神经发育障碍的表观遗传机制
- 批准号:
10816703 - 财政年份:2023
- 资助金额:
$ 80.25万 - 项目类别:
An experimentally-refined, dynamic gene regulatory network model of T-cell memory
经过实验改进的 T 细胞记忆动态基因调控网络模型
- 批准号:
10576265 - 财政年份:2021
- 资助金额:
$ 80.25万 - 项目类别:
An experimentally-refined, dynamic gene regulatory network model of T-cell memory
经过实验改进的 T 细胞记忆动态基因调控网络模型
- 批准号:
10210685 - 财政年份:2021
- 资助金额:
$ 80.25万 - 项目类别:
Commercialization of SciDAP, a next generation universal platform for collaborative data analysis
SciDAP 的商业化,下一代协作数据分析通用平台
- 批准号:
10338010 - 财政年份:2021
- 资助金额:
$ 80.25万 - 项目类别:
An experimentally-refined, dynamic gene regulatory network model of T-cell memory
经过实验改进的 T 细胞记忆动态基因调控网络模型
- 批准号:
10368121 - 财政年份:2021
- 资助金额:
$ 80.25万 - 项目类别:
An experimentally-refined, dynamic gene regulatory network model of T-cell memory
经过实验改进的 T 细胞记忆动态基因调控网络模型
- 批准号:
10213550 - 财政年份:2020
- 资助金额:
$ 80.25万 - 项目类别:
Death-Seq, a Method for Genome-wide Identification of Functional Silencer Elements
Death-Seq,一种全基因组识别功能性沉默元件的方法
- 批准号:
9979291 - 财政年份:2020
- 资助金额:
$ 80.25万 - 项目类别:
SciDAP: a next generation universal platform for collaborative data analysis
SciDAP:下一代协作数据分析通用平台
- 批准号:
10081764 - 财政年份:2020
- 资助金额:
$ 80.25万 - 项目类别:
相似国自然基金
采用新型视觉-电刺激配对范式长期、特异性改变成年期动物视觉系统功能可塑性
- 批准号:32371047
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
破解老年人数字鸿沟:老年人采用数字技术的决策过程、客观障碍和应对策略
- 批准号:72303205
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
通过抑制流体运动和采用双能谱方法来改进烧蚀速率测量的研究
- 批准号:12305261
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
采用多种稀疏自注意力机制的Transformer隧道衬砌裂缝检测方法研究
- 批准号:62301339
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
政策激励、信息传递与农户屋顶光伏技术采用提升机制研究
- 批准号:72304103
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
Programming of Resident Macrophages by the Brain Environment Following Transplantation
移植后大脑环境对常驻巨噬细胞的编程
- 批准号:
10790219 - 财政年份:2023
- 资助金额:
$ 80.25万 - 项目类别:
Engineering 3D Osteosarcoma Models to Elucidate Biology and Inform Drug Discovery
工程 3D 骨肉瘤模型以阐明生物学并为药物发现提供信息
- 批准号:
10564801 - 财政年份:2023
- 资助金额:
$ 80.25万 - 项目类别:
Transcriptional regulation of progenitor cell fate in craniofacial ligament regeneration
颅面韧带再生中祖细胞命运的转录调控
- 批准号:
10604551 - 财政年份:2022
- 资助金额:
$ 80.25万 - 项目类别:
Transcriptional regulation of progenitor cell fate in craniofacial ligament regeneration
颅面韧带再生中祖细胞命运的转录调控
- 批准号:
10709889 - 财政年份:2022
- 资助金额:
$ 80.25万 - 项目类别:
Impact of DNA double-strand breaks on 3D genome organization and genome stability in Alzheimer’s disease
DNA 双链断裂对阿尔茨海默病 3D 基因组组织和基因组稳定性的影响
- 批准号:
10282373 - 财政年份:2021
- 资助金额:
$ 80.25万 - 项目类别: