ARCHS4: Massive Mining of Publicly Available RNA Sequencing Data

ARCHS4:大规模挖掘公开的 RNA 测序数据

基本信息

  • 批准号:
    10693339
  • 负责人:
  • 金额:
    $ 77.51万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2022
  • 资助国家:
    美国
  • 起止时间:
    2022-09-01 至 2027-08-31
  • 项目状态:
    未结题

项目摘要

SUMMARY Many cancer-related independent studies that employ bulk and single cell RNA-seq remain under reused due to their lower findability, accessibility, interoperability, and reusability. The data from these studies can be found in the Gene Expression Omnibus (GEO) but it is provided mostly as raw FASTQ files with non-uniform metadata annotations. While some studies provide aligned reads files, these are processed non-uniformly. This shortcoming makes it difficult to query and integrate this data across studies and with additional external data. To bridge the gap that currently exists between RNA-seq data generation and RNA-seq data processing and reuse, we developed the resource All RNA-seq and ChIP-Seq Sample and Signature Search (ARCHS4). ARCHS4 provides processed RNA-seq data from GEO to support retrospective data analyses and reuse. ARCHS4 caters to users with different levels of computational expertise and has been already employed for many post-hoc analyses and projects. The goals go far beyond just providing cancer researchers with direct access to RNA-seq data through a web-based user interface. We plan to transform other transcriptomics data into RNA-seq-like profiles with Deep Learning, identify pathogenic sequences in human RNA-seq samples, identify short variants from RNA-seq reads, predict gene function from co-expression data including ways to modulate the expression of long non-coding RNAs with small molecules, and most importantly, using the ARCHS4 cost-effective infrastructure, continue to provide a free FASTQ alignment service to the community.
总结 许多采用批量和单细胞RNA-seq的癌症相关独立研究仍然处于重复使用状态, 它们的可查找性、可访问性、互操作性和可重用性较低。这些研究的数据可以在 基因表达综合数据库(GEO),但它主要作为具有非统一元数据的原始FASTQ文件提供 注释。虽然一些研究提供了对齐的读取文件,但这些文件的处理不均匀。这 这一缺陷使得难以查询和整合跨研究的数据以及额外的外部数据。 为了弥合目前存在于RNA-seq数据生成和RNA-seq数据处理之间的差距, 为了重复使用,我们开发了资源All RNA-seq和ChIP-Seq Sample and Signature Search(ARCHS 4)。 ARCHS 4提供来自GEO的经过处理的RNA-seq数据,以支持回顾性数据分析和重复使用。 ARCHS 4迎合了具有不同计算专业知识水平的用户,并已被用于 许多事后分析和项目。这些目标远远超出了仅仅为癌症研究人员提供直接的 通过基于网络的用户界面访问RNA-seq数据。我们计划将其他转录组学数据 利用深度学习技术构建类似RNA-seq的图谱,识别人类RNA-seq样本中的致病序列, 从RNA-seq读数中鉴定短变体,从共表达数据中预测基因功能,包括 用小分子调节长的非编码RNA的表达,最重要的是, ARCHS 4高性价比的基础设施,继续为社会提供免费的FASTQ对齐服务。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Avi Ma'ayan其他文献

Avi Ma'ayan的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Avi Ma'ayan', 18)}}的其他基金

The CFDE Workbench
CFDE 工作台
  • 批准号:
    10851224
  • 财政年份:
    2023
  • 资助金额:
    $ 77.51万
  • 项目类别:
Proteogenomic translator for cancer biomarker discovery towards precision medicine
用于癌症生物标志物发现和精准医学的蛋白质基因组翻译
  • 批准号:
    10442088
  • 财政年份:
    2022
  • 资助金额:
    $ 77.51万
  • 项目类别:
ARCHS4: Massive Mining of Publicly Available RNA Sequencing Data
ARCHS4:大规模挖掘公开的 RNA 测序数据
  • 批准号:
    10527721
  • 财政年份:
    2022
  • 资助金额:
    $ 77.51万
  • 项目类别:
ARCHS4: Massive Mining of Publicly Available RNA Sequencing Data
ARCHS4:大规模挖掘公开的 RNA 测序数据
  • 批准号:
    10814654
  • 财政年份:
    2022
  • 资助金额:
    $ 77.51万
  • 项目类别:
Proteogenomic translator for cancer biomarker discovery towards precision medicine
用于癌症生物标志物发现和精准医学的蛋白质基因组翻译
  • 批准号:
    10655588
  • 财政年份:
    2022
  • 资助金额:
    $ 77.51万
  • 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
  • 批准号:
    10837964
  • 财政年份:
    2020
  • 资助金额:
    $ 77.51万
  • 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
  • 批准号:
    10468520
  • 财政年份:
    2020
  • 资助金额:
    $ 77.51万
  • 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
  • 批准号:
    10444350
  • 财政年份:
    2020
  • 资助金额:
    $ 77.51万
  • 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
  • 批准号:
    10682935
  • 财政年份:
    2020
  • 资助金额:
    $ 77.51万
  • 项目类别:
Knowledge Management Center for Illuminating the Druggable Genome
阐明可药物基因组的知识管理中心
  • 批准号:
    10560469
  • 财政年份:
    2018
  • 资助金额:
    $ 77.51万
  • 项目类别:

相似海外基金

DMS-EPSRC: Asymptotic Analysis of Online Training Algorithms in Machine Learning: Recurrent, Graphical, and Deep Neural Networks
DMS-EPSRC:机器学习中在线训练算法的渐近分析:循环、图形和深度神经网络
  • 批准号:
    EP/Y029089/1
  • 财政年份:
    2024
  • 资助金额:
    $ 77.51万
  • 项目类别:
    Research Grant
CAREER: Blessing of Nonconvexity in Machine Learning - Landscape Analysis and Efficient Algorithms
职业:机器学习中非凸性的祝福 - 景观分析和高效算法
  • 批准号:
    2337776
  • 财政年份:
    2024
  • 资助金额:
    $ 77.51万
  • 项目类别:
    Continuing Grant
CAREER: From Dynamic Algorithms to Fast Optimization and Back
职业:从动态算法到快速优化并返回
  • 批准号:
    2338816
  • 财政年份:
    2024
  • 资助金额:
    $ 77.51万
  • 项目类别:
    Continuing Grant
CAREER: Structured Minimax Optimization: Theory, Algorithms, and Applications in Robust Learning
职业:结构化极小极大优化:稳健学习中的理论、算法和应用
  • 批准号:
    2338846
  • 财政年份:
    2024
  • 资助金额:
    $ 77.51万
  • 项目类别:
    Continuing Grant
CRII: SaTC: Reliable Hardware Architectures Against Side-Channel Attacks for Post-Quantum Cryptographic Algorithms
CRII:SaTC:针对后量子密码算法的侧通道攻击的可靠硬件架构
  • 批准号:
    2348261
  • 财政年份:
    2024
  • 资助金额:
    $ 77.51万
  • 项目类别:
    Standard Grant
CRII: AF: The Impact of Knowledge on the Performance of Distributed Algorithms
CRII:AF:知识对分布式算法性能的影响
  • 批准号:
    2348346
  • 财政年份:
    2024
  • 资助金额:
    $ 77.51万
  • 项目类别:
    Standard Grant
CRII: CSR: From Bloom Filters to Noise Reduction Streaming Algorithms
CRII:CSR:从布隆过滤器到降噪流算法
  • 批准号:
    2348457
  • 财政年份:
    2024
  • 资助金额:
    $ 77.51万
  • 项目类别:
    Standard Grant
EAGER: Search-Accelerated Markov Chain Monte Carlo Algorithms for Bayesian Neural Networks and Trillion-Dimensional Problems
EAGER:贝叶斯神经网络和万亿维问题的搜索加速马尔可夫链蒙特卡罗算法
  • 批准号:
    2404989
  • 财政年份:
    2024
  • 资助金额:
    $ 77.51万
  • 项目类别:
    Standard Grant
CAREER: Efficient Algorithms for Modern Computer Architecture
职业:现代计算机架构的高效算法
  • 批准号:
    2339310
  • 财政年份:
    2024
  • 资助金额:
    $ 77.51万
  • 项目类别:
    Continuing Grant
CAREER: Improving Real-world Performance of AI Biosignal Algorithms
职业:提高人工智能生物信号算法的实际性能
  • 批准号:
    2339669
  • 财政年份:
    2024
  • 资助金额:
    $ 77.51万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了