Cancer Genomics: Integrative and Scalable Solutions in R/Bioconductor
癌症基因组学:R/Bioconductor 中的集成且可扩展的解决方案
基本信息
- 批准号:10594231
- 负责人:
- 金额:$ 31.86万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2021
- 资助国家:美国
- 起止时间:2021-09-01 至 2024-08-31
- 项目状态:已结题
- 来源:
- 关键词:Administrative SupplementBioconductorBioinformaticsBiologicalCellsCharacteristicsCodeCohort StudiesCollaborationsCommunitiesComputer softwareDataData SetDepositionDocumentationEcosystemEpigenetic ProcessEthnic OriginGene ExpressionGenomicsGeographic LocationsGeographyIndividualLearningMachine LearningMaintenanceMalignant NeoplasmsManualsMetadataMetagenomicsMethodsMinorityMinority GroupsModelingModificationMutationParticipantProcessRaceReadinessRecordsReproducibilityResearchResearch PersonnelResourcesReview LiteratureRunningSamplingSequence Read ArchiveSourceStandardizationStructureTensorFlowTextThe Cancer Genome AtlasTrainingTranslatingUnderrepresented PopulationsUnited States National Institutes of HealthbasecBioPortalcancer genomicscohortdata miningdata modelingdata repositorydata resourcedesigngenomic datahealth disparityimprovedinterestlarge scale dataliteratemachine learning algorithmmarginalized populationmultimodalityonline resourceopen sourceparent grantplatform-independentrecruitrepositorysexsoftware developmentusability
项目摘要
Project Summary
Bioconductor is an ecosystem of more than 2,000 open-source software packages for the reproducible
bioinformatics analysis of various types of genomic data. Aim 1 of our parent grant, “Cancer Genomics:
Integrative and Scalable Solutions in R/Bioconductor” (7U24CA180996), develops and maintains
R/Bioconductor data structures for representation, downstream software development, and analysis of
multimodal cancer datasets. Aim 3 of our parent grant establishes ExperimentHub web resources for the
curation, distribution, maintenance, discoverability, and usability of cancer data resources for the
R/Bioconductor community. This proposal targets hundreds of primarily cancer-focused genomic and
metagenomic datasets that are optimized for R/Bioconductor-based usage and contain significant value-added
over primary sources in the form of harmonization and manual curation, but for which substantial domain and
Bioconductor-specific expertise is currently required to translate into formats suitable for widely used AI/ML
softwares. First, it creates the Bioconductor Machine Learning Repository for Omics by translating existing
R/Bioconductor versions of TCGA, cBioPortal, metagenomics, and other datasets. Second, in order to assess
representation and generalizability of any models developed, it employs manual curation to uniformly annotate
key characteristics of each study cohort including race/ethnicity, sex as a biological variable, geographical
location, and recruitment period. Finally, it provides runnable documented examples of the import and use of
these datasets in TensorFlow, PyTorch, and scikit-learn. In total, this proposal will produce the first large-scale,
platform-independent, AI/ML-ready data repository for diverse and highly curated omics data. Thorough
annotation on minority status of the studies and samples in our repository will facilitate the identification of
biases and health disparities for marginalized populations.
项目摘要
Bioconductor是一个由2,000多个开源软件包组成的生态系统,
生物信息学分析各种类型的基因组数据。我们母基金的目标1,“癌症基因组学:
R/Bioconductor中的集成和可扩展解决方案”(7 U24 CA 180996),开发和维护
R/Bioconductor数据结构,用于表示、下游软件开发和分析
多模态癌症数据集。我们的母基金的目标3建立了实验中心的网络资源,
癌症数据资源的管理、分发、维护、可重复性和可用性,
R/Bioconductor社区该提案针对数百个主要以癌症为重点的基因组和
宏基因组数据集针对基于R/Bioconductor的用途进行了优化,并包含显著的附加值
以协调和手动管理的形式对主要来源进行管理,但对于哪些实质性领域和
目前需要生物导体特定的专业知识来转化为适用于广泛使用的AI/ML的格式
软件。首先,它通过翻译现有的生物导体机器学习库来创建组学
R/Bioconductor版本的TCGA、cBioPortal、宏基因组学和其他数据集。第二,为了评估
表示和推广任何开发的模型,它采用手动策展统一注释
每个研究队列的关键特征,包括人种/种族、作为生物学变量的性别、地理
地点和招聘期限。最后,它提供了导入和使用
TensorFlow、PyTorch和scikit-learn中的这些数据集。总的来说,这项提案将产生第一个大规模的,
独立于平台的AI/ML就绪数据存储库,用于存储多样化和高度策划的组学数据。彻底
对我们储存库中的研究和样本的少数地位进行注释,将有助于识别
对边缘化人群的偏见和健康差距。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Martin T Morgan其他文献
Martin T Morgan的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Martin T Morgan', 18)}}的其他基金
Cancer Genomics: Integrative and Scalable Solutions in R/Bioconductor
癌症基因组学:R/Bioconductor 中的集成且可扩展的解决方案
- 批准号:
10703230 - 财政年份:2021
- 资助金额:
$ 31.86万 - 项目类别:
Cancer Genomics: Integrative and Scalable Solutions in R/Bioconductor
癌症基因组学:R/Bioconductor 中的集成且可扩展的解决方案
- 批准号:
10449603 - 财政年份:2021
- 资助金额:
$ 31.86万 - 项目类别:
Cancer Genomics: Integrative and Scalable Solutions in R/Bioconductor
癌症基因组学:R/Bioconductor 中的集成且可扩展的解决方案
- 批准号:
10478123 - 财政年份:2021
- 资助金额:
$ 31.86万 - 项目类别:
Cancer Genomics:Integrative and Scalable Solutions in R / Bioconductor
癌症基因组学:R / Bioconductor 中的集成且可扩展的解决方案
- 批准号:
9186264 - 财政年份:2014
- 资助金额:
$ 31.86万 - 项目类别:
Cancer Genomics:Integrative and Scalable Solutions in R / Bioconductor
癌症基因组学:R / Bioconductor 中的集成且可扩展的解决方案
- 批准号:
9334747 - 财政年份:2014
- 资助金额:
$ 31.86万 - 项目类别:
Cancer Genomics: Integrative and Salable Solutions in R/Bioconductor
癌症基因组学:R/Bioconductor 中的综合且可销售的解决方案
- 批准号:
10017896 - 财政年份:2014
- 资助金额:
$ 31.86万 - 项目类别:
Cancer Genomics:Integrative and Scalable Solutions in R / Bioconductor
癌症基因组学:R / Bioconductor 中的集成且可扩展的解决方案
- 批准号:
9122328 - 财政年份:2014
- 资助金额:
$ 31.86万 - 项目类别:
Bioconductor: An Open Computing Resource for Genomics
Bioconductor:基因组学的开放计算资源
- 批准号:
9922952 - 财政年份:2006
- 资助金额:
$ 31.86万 - 项目类别:
Bioconductor: An Open Computing Resource for Genomics
Bioconductor:基因组学的开放计算资源
- 批准号:
8723329 - 财政年份:2006
- 资助金额:
$ 31.86万 - 项目类别:
Bioconductor: An Open Computing Resource for Genomics
Bioconductor:基因组学的开放计算资源
- 批准号:
8243004 - 财政年份:2006
- 资助金额:
$ 31.86万 - 项目类别:
相似海外基金
Supplement: Enhancing Community Contributions to Bioconductor With Build System Containerization and a GPU for Testing
补充:通过构建系统容器化和用于测试的 GPU 增强社区对 Bioconductor 的贡献
- 批准号:
10838736 - 财政年份:2023
- 资助金额:
$ 31.86万 - 项目类别:
Data infrastructure for single-cell multiplex imaging in Bioconductor
Bioconductor 中单细胞多重成像的数据基础设施
- 批准号:
10831240 - 财政年份:2022
- 资助金额:
$ 31.86万 - 项目类别:
Cancer Genomics: Integrative and Scalable Solutions in R/Bioconductor
癌症基因组学:R/Bioconductor 中的集成且可扩展的解决方案
- 批准号:
10703230 - 财政年份:2021
- 资助金额:
$ 31.86万 - 项目类别:
Durable Common Fund Data Interfaces and Tutorials with Bioconductor
持久的共同基金数据接口和 Bioconductor 教程
- 批准号:
10356362 - 财政年份:2021
- 资助金额:
$ 31.86万 - 项目类别:
Cancer Genomics: Integrative and Scalable Solutions in R/Bioconductor
癌症基因组学:R/Bioconductor 中的集成且可扩展的解决方案
- 批准号:
10449603 - 财政年份:2021
- 资助金额:
$ 31.86万 - 项目类别:
Cancer Genomics: Integrative and Scalable Solutions in R/Bioconductor
癌症基因组学:R/Bioconductor 中的集成且可扩展的解决方案
- 批准号:
10478123 - 财政年份:2021
- 资助金额:
$ 31.86万 - 项目类别:
Accelerating Cancer Genomics with Cloud-scale Bioconductor
利用云规模 Bioconductor 加速癌症基因组学
- 批准号:
9478159 - 财政年份:2017
- 资助金额:
$ 31.86万 - 项目类别:
Cancer Genomics:Integrative and Scalable Solutions in R / Bioconductor
癌症基因组学:R / Bioconductor 中的集成且可扩展的解决方案
- 批准号:
9186264 - 财政年份:2014
- 资助金额:
$ 31.86万 - 项目类别:
Cancer Genomics:Integrative and Scalable Solutions in R / Bioconductor
癌症基因组学:R / Bioconductor 中的集成且可扩展的解决方案
- 批准号:
9334747 - 财政年份:2014
- 资助金额:
$ 31.86万 - 项目类别:
Cancer Genomics: Integrative and Salable Solutions in R/Bioconductor
癌症基因组学:R/Bioconductor 中的综合且可销售的解决方案
- 批准号:
10017896 - 财政年份:2014
- 资助金额:
$ 31.86万 - 项目类别: