High-Throughput Computing for Genomics and Bioinformatics Research
用于基因组学和生物信息学研究的高通量计算
基本信息
- 批准号:10176848
- 负责人:
- 金额:$ 57.36万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2021
- 资助国家:美国
- 起止时间:2021-07-01 至 2022-06-30
- 项目状态:已结题
- 来源:
- 关键词:AreaBioinformaticsBiomedical ComputingCLC GeneCellular biologyCollaborationsComputer softwareDataData ScienceData SetDevelopmentDiseaseEducationEducation and OutreachEducational workshopEnsureFundingGenomicsHealth Science LibraryHealth SciencesHigh Performance ComputingHourInfrastructureInstitutesInstitutionLicensingLinkLongevityMalignant Childhood NeoplasmMedicineMemoryModelingMolecular BiologyMonitorResearchResearch PersonnelResearch SupportRunningScienceSecureSupport SystemSystemTaxonomyTechniquesUnited States National Institutes of HealthUniversitiescluster computingcomputing resourcescost effectiveimage reconstructionnext generation sequencingoperationprecision medicineprogramstooltumor immunology
项目摘要
Biomedical researchers have an increasing ability to comprehensively interrogate cell and molecular biology,
for example with advanced imaging and next-generation sequencing. These techniques are producing
datasets of increasing size and complexity and necessitate high-performance computing for biomedical
researchers. Results from these studies are rapidly changing our understanding of normal development, our
taxonomy of disease, and ultimately will enable precision medicine.
Recognizing the importance of data science in precision medicine, the Institute for Precision Medicine (IPM)
and the University of Pittsburgh invested in a high-throughput computing cluster (HTC), with infrastructure
suited for memory-intensive and IO-intensive genomic and bioinformatic operations, and an education program
dedicated to enabling computing for health science researchers. The HTC is located in the Center for
Research Computing (CRC), a secure and centralized enterprise facility providing computing resources to the
whole of the University. The CRC provides a scalable model for research computing with expertise in use and
monitoring of advanced computing. In 2015, the HTC was installed with 16 nodes (256 cores). Usage of the
HTC grew rapidly (2016 - 0.5M core-hours to 2019 – 3.1M core-hours), and despite the addition of computing
nodes in 2017 (4 nodes), 2018 (4 nodes) and 2019 (16 nodes) the system often runs at capacity. Furthermore,
the nodes have reached their useable lifespan. In this application, we are requesting funds to replace the HTC
cluster and increase computing availability with a new cluster of 20 CPU nodes (960 cores) and 8 GPU cards,
2 CPU nodes as application servers, and 1.2 PB of BeeGFS storage, all linked by Infiniband HDR networking.
The new HTC cluster is dedicated to NIH-funded research in biomedical science including medicine, pediatrics,
cancer, immunology, and other areas. To assist health science researchers, the IPM, CRC and the health
science library system (HSLS) support institution-wide licenses from numerous analysis and bioinformatics
software suites, several of which are installed on the HTC server. Importantly, HSLS and CRC provide
education outreach through workshops for command line tools, R for genomics and software suites.
Researchers using software suites such as CLC Genomics, Open OnDemand, or command line can
transparently migrate data and perform analysis on the multi-core HTC. IPM collaboration with the CRC
ensures that the new HTC cluster will be operated in the most cost-effective and efficient manner and will be of
high value to health sciences researcher performing NIH-supported research. This collaborative effort
significantly reduces barriers for biomedical researchers needing to perform computational research.
生物医学研究人员具有越来越多的全面询问细胞和分子生物学的能力,
例如,使用高级成像和下一代测序。这些技术正在生产
大小和复杂性的增加数据集以及生物医学的必要高性能计算
研究人员。这些研究的结果正在迅速改变我们对正常发展的理解
疾病的分类法,最终将启用精确医学。
认识到数据科学在精密医学中的重要性,精密医学研究所(IPM)
匹兹堡大学投资了一个高通量计算集群(HTC),其基础设施
适用于记忆密集型和IO密集型基因组和生物信息学操作,以及一个教育计划
致力于为健康科学研究人员提供计算。 HTC位于中心
研究计算(CRC)是一种安全的集中式企业设施,为计算资源提供了
整个大学。 CRC提供了具有使用专业知识的研究计算的可扩展模型,
监视高级计算。 2015年,HTC安装了16个节点(256个核心)。使用
HTC迅速增长(2016年至2019年核心小时至2019年的核心小时),并增加计算
2017年的节点(4个节点),2018年(4个节点)和2019年(16个节点),该系统通常以容量运行。此外,
节点已经达到了可用的寿命。在此应用程序中,我们要求资金替换HTC
群集并增加了20个CPU节点(960个内核)和8张GPU卡的新群集的计算可用性,
2个CPU节点作为应用程序服务器,BeeGFS存储的1.2 pb,为Infiniband HDR网络链接。
新的HTC集群致力于NIH资助的生物医学研究研究,包括医学,儿科,
癌症,免疫学和其他领域。为了帮助健康科学研究人员,IPM,CRC和健康
科学图书馆系统(HSLS)支持众多分析和生物信息学的机构许可证
软件套件,其中几个安装在HTC服务器上。重要的是,HSL和CRC提供
通过命令行工具的研讨会教育宣传,用于基因组学和软件套件的R。
使用软件套件的研究人员,例如CLC基因组学,开放式ONDEMAND或命令行可以
透明地迁移数据并对多核HTC进行分析。 IPM与CRC合作
确保新的HTC群集将以最具成本效益和高效的方式运行,并将
对健康科学的高价值研究人员进行NIH支持的研究。这项协作努力
显着减少了生物医学研究人员的障碍,需要进行计算研究。
项目成果
期刊论文数量(21)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
ESR1 fusion proteins invoke breast cancer subtype-dependent enrichment of ligand independent pro-oncogenic signatures and phenotypes.
ESR1融合蛋白引起乳腺癌亚型依赖性配体独立的促癌特征和表型的富集。
- DOI:10.1101/2023.09.18.558175
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Yates,MeganE;Li,Zheqi;Li,Yiting;Guzolik,Hannah;Wang,Xiaosong;Liu,Tiantong;Hooda,Jagmohan;Atkinson,JenniferM;Lee,AdrianV;Oesterreich,Steffi
- 通讯作者:Oesterreich,Steffi
Defining spatiotemporal gene modules in liver regeneration using Analytical Dynamic Visual Spatial Omics Representation (ADViSOR).
- DOI:10.1097/hc9.0000000000000289
- 发表时间:2023-11-01
- 期刊:
- 影响因子:5.1
- 作者:
- 通讯作者:
Sin3a associated protein 130 kDa, sap130, plays an evolutionary conserved role in zebrafish heart development.
- DOI:10.3389/fcell.2023.1197109
- 发表时间:2023
- 期刊:
- 影响因子:5.5
- 作者:
- 通讯作者:
Preservation of ∼12-h ultradian rhythms of gene expression of mRNA and protein metabolism in the absence of canonical circadian clock.
- DOI:10.3389/fphys.2023.1195001
- 发表时间:2023
- 期刊:
- 影响因子:4
- 作者:
- 通讯作者:
Loss of TAZ after YAP deletion severely impairs foregut development and worsens cholestatic hepatocellular injury.
- DOI:10.1097/hc9.0000000000000220
- 发表时间:2023-09-01
- 期刊:
- 影响因子:5.1
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Adrian V Lee其他文献
Adrian V Lee的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Adrian V Lee', 18)}}的其他基金
Credentialing Models of Invasive Lobular Breast Cancer for Translational Research
用于转化研究的侵袭性小叶乳腺癌模型认证
- 批准号:
10219509 - 财政年份:2021
- 资助金额:
$ 57.36万 - 项目类别:
Credentialing Models of Invasive Lobular Breast Cancer for Translational Research
用于转化研究的侵袭性小叶乳腺癌模型认证
- 批准号:
10589777 - 财政年份:2021
- 资助金额:
$ 57.36万 - 项目类别:
Estrogen receptor fusions genes as drivers of endocrine resistance in breast cancer
雌激素受体融合基因作为乳腺癌内分泌抵抗的驱动因素
- 批准号:
10219505 - 财政年份:2021
- 资助金额:
$ 57.36万 - 项目类别:
Estrogen receptor fusions genes as drivers of endocrine resistance in breast cancer
雌激素受体融合基因作为乳腺癌内分泌抵抗的驱动因素
- 批准号:
10605355 - 财政年份:2021
- 资助金额:
$ 57.36万 - 项目类别:
Estrogen receptor fusions genes as drivers of endocrine resistance in breast cancer
雌激素受体融合基因作为乳腺癌内分泌抵抗的驱动因素
- 批准号:
10373094 - 财政年份:2021
- 资助金额:
$ 57.36万 - 项目类别:
Developing and credentialing murine models of ILC
ILC 小鼠模型的开发和认证
- 批准号:
10830524 - 财政年份:2021
- 资助金额:
$ 57.36万 - 项目类别:
Credentialing Models of Invasive Lobular Breast Cancer for Translational Research
用于转化研究的侵袭性小叶乳腺癌模型认证
- 批准号:
10378642 - 财政年份:2021
- 资助金额:
$ 57.36万 - 项目类别:
Targeting the IGF Pathway for Treatment of Breast Cancer
靶向 IGF 通路治疗乳腺癌
- 批准号:
7385535 - 财政年份:2007
- 资助金额:
$ 57.36万 - 项目类别:
IGF-1& its Cross-Talk with Estrogen in Breast Tumor Grow
胰岛素样生长因子1
- 批准号:
6989330 - 财政年份:2004
- 资助金额:
$ 57.36万 - 项目类别:
IRS1 and 2 Signaling in Mammary Development and Cancer
IRS1 和 2 信号在乳房发育和癌症中的作用
- 批准号:
6620551 - 财政年份:2002
- 资助金额:
$ 57.36万 - 项目类别:
相似国自然基金
2023年(第四届)国际生物数学与医学应用研讨会
- 批准号:12342004
- 批准年份:2023
- 资助金额:8.00 万元
- 项目类别:专项项目
突变和修饰重塑蛋白质亚细胞定位的生物信息学研究
- 批准号:32370698
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
基于生物信息学的类风湿性关节炎患者衰弱预测模型的构建与验证
- 批准号:82301786
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于结构表征的蛋白质与长链非编码RNA相互作用预测的生物信息学方法研究
- 批准号:62373216
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
蛋白质降解决定因子的生物信息学筛选及其耐药突变的多组学分析研究
- 批准号:32300528
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
A web-based platform for robust single-cell analysis, bulk data deconvolution and system-level analysis
基于网络的平台,用于强大的单细胞分析、批量数据反卷积和系统级分析
- 批准号:
10766073 - 财政年份:2023
- 资助金额:
$ 57.36万 - 项目类别:
Developing unbiased AI/Deep learning pipelines to strengthen lung cancer health disparities research
开发公正的人工智能/深度学习管道以加强肺癌健康差异研究
- 批准号:
10841956 - 财政年份:2023
- 资助金额:
$ 57.36万 - 项目类别:
Indiana Genomics Research Training Program for Data Scientists (INGEN4DS)
印第安纳州数据科学家基因组学研究培训计划 (INGEN4DS)
- 批准号:
10410773 - 财政年份:2022
- 资助金额:
$ 57.36万 - 项目类别:
Resource for Macromolecular Modeling and Visualization
高分子建模和可视化资源
- 批准号:
10431033 - 财政年份:2022
- 资助金额:
$ 57.36万 - 项目类别: