Cancer Genomics: Integrative and Scalable Solutions in R/Bioconductor

癌症基因组学:R/Bioconductor 中的集成且可扩展的解决方案

基本信息

项目摘要

Project Summary Bioconductor is an ecosystem of more than 2,000 open-source software packages for the reproducible bioinformatics analysis of various types of genomic data. Aim 1 of our parent grant, “Cancer Genomics: Integrative and Scalable Solutions in R/Bioconductor” (7U24CA180996), develops and maintains R/Bioconductor data structures for representation, downstream software development, and analysis of multimodal cancer datasets. Aim 3 of our parent grant establishes ExperimentHub web resources for the curation, distribution, maintenance, discoverability, and usability of cancer data resources for the R/Bioconductor community. This proposal targets hundreds of primarily cancer-focused genomic and metagenomic datasets that are optimized for R/Bioconductor-based usage and contain significant value-added over primary sources in the form of harmonization and manual curation, but for which substantial domain and Bioconductor-specific expertise is currently required to translate into formats suitable for widely used AI/ML softwares. First, it creates the Bioconductor Machine Learning Repository for Omics by translating existing R/Bioconductor versions of TCGA, cBioPortal, metagenomics, and other datasets. Second, in order to assess representation and generalizability of any models developed, it employs manual curation to uniformly annotate key characteristics of each study cohort including race/ethnicity, sex as a biological variable, geographical location, and recruitment period. Finally, it provides runnable documented examples of the import and use of these datasets in TensorFlow, PyTorch, and scikit-learn. In total, this proposal will produce the first large-scale, platform-independent, AI/ML-ready data repository for diverse and highly curated omics data. Thorough annotation on minority status of the studies and samples in our repository will facilitate the identification of biases and health disparities for marginalized populations.
项目摘要 生物导体是一个超过2,000个开源软件包的生态系统,可重现 各种类型基因组数据的生物信息学分析。我们的父母授予的目标1:“癌症基因组学: R/Bioconductor中的集成和可扩展的解决方案”(7U24CA180996),开发和维护 用于表示,下游软件开发和分析的R/Bioconductor数据结构 多模式癌数据集。我们父母赠款的目标3建立了实验性网络资源 癌症数据资源的策划,分配,维护,可发现性和可用性 R/Bioconductor社区。该建议针对数百种以癌症为中心的基因组和 用于基于R/bioconductor的用法优化并包含大量增值的宏基因组数据集 以统一和手动策划形式的主要来源,但为此而实现的领域和 目前需要特定于生物导体的专业知识才能转化为适用于广泛使用的AI/ML的格式 软件。首先,它通过翻译现有 TCGA,CBIOPORTAL,MENAGENOMICS和其他数据集的R/Bioconductor版本。第二,为了评估 任何开发的模型的表示和普遍性,它都采用手动策划均匀注释 每个研究队列的关键特征,包括种族/种族,性别作为生物变量,地理 位置和招聘期。最后,它提供了可运行的记录的导入和使用的示例 这些数据集中有Tensorflow,Pytorch和Scikit-Learn。总的来说,该提案将产生第一个大规模的 无独立的AI/ML准备数据存储库,用于多种多样,高度策划的OMICS数据。彻底 对我们存储库中研究和样本的少数群体状况的注释将有助于识别 边缘化人群的偏见和健康差异。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Martin T Morgan其他文献

Martin T Morgan的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Martin T Morgan', 18)}}的其他基金

Cancer Genomics: Integrative and Scalable Solutions in R/Bioconductor
癌症基因组学:R/Bioconductor 中的集成且可扩展的解决方案
  • 批准号:
    10703230
  • 财政年份:
    2021
  • 资助金额:
    $ 31.86万
  • 项目类别:
Cancer Genomics: Integrative and Scalable Solutions in R/Bioconductor
癌症基因组学:R/Bioconductor 中的集成且可扩展的解决方案
  • 批准号:
    10449603
  • 财政年份:
    2021
  • 资助金额:
    $ 31.86万
  • 项目类别:
Cancer Genomics: Integrative and Scalable Solutions in R/Bioconductor
癌症基因组学:R/Bioconductor 中的集成且可扩展的解决方案
  • 批准号:
    10478123
  • 财政年份:
    2021
  • 资助金额:
    $ 31.86万
  • 项目类别:
Cancer Genomics:Integrative and Scalable Solutions in R / Bioconductor
癌症基因组学:R / Bioconductor 中的集成且可扩展的解决方案
  • 批准号:
    9186264
  • 财政年份:
    2014
  • 资助金额:
    $ 31.86万
  • 项目类别:
Cancer Genomics:Integrative and Scalable Solutions in R / Bioconductor
癌症基因组学:R / Bioconductor 中的集成且可扩展的解决方案
  • 批准号:
    9334747
  • 财政年份:
    2014
  • 资助金额:
    $ 31.86万
  • 项目类别:
Cancer Genomics: Integrative and Salable Solutions in R/Bioconductor
癌症基因组学:R/Bioconductor 中的综合且可销售的解决方案
  • 批准号:
    10017896
  • 财政年份:
    2014
  • 资助金额:
    $ 31.86万
  • 项目类别:
Cancer Genomics:Integrative and Scalable Solutions in R / Bioconductor
癌症基因组学:R / Bioconductor 中的集成且可扩展的解决方案
  • 批准号:
    9122328
  • 财政年份:
    2014
  • 资助金额:
    $ 31.86万
  • 项目类别:
Bioconductor: An Open Computing Resource for Genomics
Bioconductor:基因组学的开放计算资源
  • 批准号:
    9922952
  • 财政年份:
    2006
  • 资助金额:
    $ 31.86万
  • 项目类别:
Bioconductor: An Open Computing Resource for Genomics
Bioconductor:基因组学的开放计算资源
  • 批准号:
    8723329
  • 财政年份:
    2006
  • 资助金额:
    $ 31.86万
  • 项目类别:
Bioconductor: An Open Computing Resource for Genomics
Bioconductor:基因组学的开放计算资源
  • 批准号:
    8243004
  • 财政年份:
    2006
  • 资助金额:
    $ 31.86万
  • 项目类别:

相似国自然基金

半导体矿物-光合色素协同强化地表水体微生物光电产甲烷机制
  • 批准号:
    42307305
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
多通道半导体光电化学生物传感器的多重界面调和机制研究及其在抑郁症检测中的应用
  • 批准号:
    62301446
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
半导体纳米片锚定贵金属(Au、Ag、Cu)单原子SERS生物探针的可控制备和增强机制研究
  • 批准号:
    12374390
  • 批准年份:
    2023
  • 资助金额:
    53.00 万元
  • 项目类别:
    面上项目
用于光驱动化学品合成的半导体材料-微生物杂合体的生产策略研究
  • 批准号:
    32300065
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于原子层沉积半导体沟道的FET生物传感器构筑与性能调控
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Novel Computational Methods for Microbiome Data Analysis in Longitudinal Study
纵向研究中微生物组数据分析的新计算方法
  • 批准号:
    10660234
  • 财政年份:
    2023
  • 资助金额:
    $ 31.86万
  • 项目类别:
Data Core
数据核心
  • 批准号:
    10806551
  • 财政年份:
    2023
  • 资助金额:
    $ 31.86万
  • 项目类别:
Leveraging evolutionary analyses and machine learning to discover multiscale molecular features associated with antibiotic resistance
利用进化分析和机器学习发现与抗生素耐药性相关的多尺度分子特征
  • 批准号:
    10658686
  • 财政年份:
    2023
  • 资助金额:
    $ 31.86万
  • 项目类别:
Immuno-Oncology Translation Network: Data Management and Resource-Sharing Center at RPCI
免疫肿瘤学翻译网络:RPCI 的数据管理和资源共享中心
  • 批准号:
    10872397
  • 财政年份:
    2023
  • 资助金额:
    $ 31.86万
  • 项目类别:
System-Level Analyses of Multi-Omics Data to Reveal Mechanisms of Head & Neck Cancer
多组学数据的系统级分析揭示头部机制
  • 批准号:
    10593974
  • 财政年份:
    2022
  • 资助金额:
    $ 31.86万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了