Ultra-fast haplotype phasing and genotype imputation service using a hybrid FPGA-GPU system
使用混合 FPGA-GPU 系统的超快速单倍型定相和基因型插补服务
基本信息
- 批准号:351403079
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:德国
- 项目类别:Research Grants
- 财政年份:2017
- 资助国家:德国
- 起止时间:2016-12-31 至 2021-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Large-scale international community projects such as the United States 1-million-volunteer health study were launched to sequence the genomes of more than one million individuals. A major use of this key DNA reference data is to allow phasing and imputation, i.e. estimating personal haplotypes and predicting missing genotypes of individual genome-wide data of diverse clinical biobanks worldwide. However, utilizing the most recent haplotype reference population of more than 32,000 European individuals keep even powerful dedicated cluster systems, such as the Sanger Imputation Service (SIS), running for days. Faster and more energy-efficient computational architectures are required to reduce the computational requirements by several orders of magnitude in order to actually allow for all new practical benefits from using diverse sets of worldwide reference populations and larger reference panels.We propose to provide a phasing and imputation webservice based on the development of an ultra-fast haplotype phasing and genotype imputation hybrid FPGA-GPU system to enable ultra-fast phasing and imputation from diverse sets of reference populations. Targeting a hybrid composition of Field-Programmable Gate Arrays (FPGAs) and Graphical Processing Units (GPUs) introduces a new promising field of scientific research for algorithmic design. Besides, we will algorithmically improve the HapHedge data structure of the SIS to develop another fast lookup algorithm perfectly suited to parallel use and FPGA structure. For haplotype phasing and imputation based on the recent Eagle v2 and PBWT tools our pessimistic, i.e. lower bound, expectations already show a speedup of at least 164 and 142 on one single FPGA processor as compared to a 16-core CPU machine and the Sanger Imputation Service, respectively, thereby reducing the runtime for a medium-size genome-wide data set from days to minutes. Thus, for phasing and imputation, a single standard computing system with only four FPGA processors, as we plan to provide for our service, is as powerful as a large HPC computing cluster of more than 650 16-core CPU cores for parallel computing, while saving more than 99% of energy, and that does not even take our planned GPU integration into account.Further, we propose to implement and provide the research community with a freely accessible graphical decision-making web-interface. We already designed a "conversational interface" prototype to enable quick and easy phasing and imputation from diverse sets of reference panels in conjunction with an "on-the-fly" estimation of phasing and imputation accuracy during runtime. The hybrid FPGA-GPU-based phasing and imputation service will open up entirely new possibilities for applied genetic research, e.g. toggling between imputation panels from diverse sets of worldwide reference populations, to ultimately maximize phasing and imputation accuracy on the individual level - an important prerequisite for personalized medicine.
开展了大规模的国际社会项目,如美国100万志愿者健康研究,对100多万人的基因组进行排序。这种关键DNA参考数据的主要用途是允许定相和插补,即估计个人单倍型和预测全球不同临床生物库的个体全基因组数据的缺失基因型。然而,利用超过32,000个欧洲个体的最新单倍型参考群体,即使是强大的专用聚类系统,如桑格插补服务(SIS),也要运行数天。更快和更节能的计算架构需要将计算需求降低几个数量级,以便实际上允许使用不同的全球参考群体和更大的参考面板的所有新的实际好处。我们建议提供基于超快速单体型定相和基因型插补混合FPGA-GPU系统的开发的定相和插补网络服务,以实现超快速单体型定相和基因型插补。快速定相和从不同的参考人群中插补。针对现场可编程门阵列(FPGA)和图形处理单元(GPU)的混合组合,为算法设计引入了一个新的有前途的科学研究领域。此外,我们将在算法上改进SIS的HapHedge数据结构,以开发出另一种适合并行使用和FPGA结构的快速查找算法。对于基于最近的Eagle v2和PBWT工具的单倍型定相和插补,我们的悲观(即下限)预期已经显示,与16核CPU机器和桑格插补服务相比,单个FPGA处理器上的加速分别为至少164和142,从而将中等大小的全基因组数据集的运行时间从几天减少到几分钟。因此,对于分阶段和估算,我们计划为我们的服务提供的仅具有四个FPGA处理器的单个标准计算系统与用于并行计算的650多个16核CPU核心的大型HPC计算集群一样强大,同时节省了99%以上的能源,甚至还没有考虑我们计划的GPU集成。我们建议实施并向研究界提供一个可自由访问的图形决策网络界面。我们已经设计了一个“对话界面”原型,可以从不同的参考面板集合中快速轻松地进行定相和插补,并在运行时对定相和插补精度进行“即时”估计。基于FPGA-GPU的混合定相和插补服务将为应用遗传研究开辟全新的可能性,例如,在来自全球不同参考人群的插补面板之间切换,以最终最大限度地提高个体水平上的定相和插补准确性-这是个性化医疗的重要先决条件。
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
EagleImp: fast and accurate genome-wide phasing and imputation in a single tool
- DOI:10.1101/2022.01.11.475810
- 发表时间:2022-01
- 期刊:
- 影响因子:5.8
- 作者:Lars Wienbrandt;D. Ellinghaus
- 通讯作者:Lars Wienbrandt;D. Ellinghaus
Reference-Based Haplotype Phasing with FPGAs
- DOI:10.1007/978-3-030-50420-5_36
- 发表时间:2020-05-22
- 期刊:
- 影响因子:0
- 作者:Wienbrandt L;Kässens JC;Ellinghaus D
- 通讯作者:Ellinghaus D
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Professor Dr. David Ellinghaus, Ph.D.其他文献
Professor Dr. David Ellinghaus, Ph.D.的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Professor Dr. David Ellinghaus, Ph.D.', 18)}}的其他基金
Whole-exome sequencing for inflammatory bowel disease patients treated with biologic agents
对接受生物制剂治疗的炎症性肠病患者进行全外显子测序
- 批准号:
458902672 - 财政年份:2021
- 资助金额:
-- - 项目类别:
Research Grants
Integrative Immunogenetics: Towards the Development of an Immune-specific Therapy for Primary Sclerosing Cholangitis
综合免疫遗传学:开发原发性硬化性胆管炎的免疫特异性疗法
- 批准号:
507145175 - 财政年份:
- 资助金额:
-- - 项目类别:
Research Grants
相似国自然基金
基于FAST搜寻及观测的脉冲星多波段辐射机制研究
- 批准号:12403046
- 批准年份:2024
- 资助金额:0 万元
- 项目类别:青年科学基金项目
FAST连续观测数据处理的pipeline开发
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于神经网络的FAST馈源融合测量算法研究
- 批准号:12363010
- 批准年份:2023
- 资助金额:31 万元
- 项目类别:地区科学基金项目
使用FAST开展河外中性氢吸收线普查
- 批准号:12373011
- 批准年份:2023
- 资助金额:52.00 万元
- 项目类别:面上项目
基于FAST的射电脉冲星搜索和候选识别的深度学习方法研究
- 批准号:12373107
- 批准年份:2023
- 资助金额:54 万元
- 项目类别:面上项目
基于FAST观测的重复快速射电暴的统计和演化研究
- 批准号:12303042
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
利用FAST漂移扫描多科学目标同时巡天宽带谱线数据研究星系中性氢质量函数
- 批准号:12373012
- 批准年份:2023
- 资助金额:52.00 万元
- 项目类别:面上项目
基于FAST望远镜及超级计算的脉冲星深度搜寻和研究
- 批准号:12373109
- 批准年份:2023
- 资助金额:55.00 万元
- 项目类别:面上项目
基于FAST高灵敏度和高谱分辨中性氢数据的暗星系的系统搜寻与研究
- 批准号:12373001
- 批准年份:2023
- 资助金额:52.00 万元
- 项目类别:面上项目
基于FAST的纳赫兹引力波研究
- 批准号:LY23A030001
- 批准年份:2023
- 资助金额:0.0 万元
- 项目类别:省市级项目
相似海外基金
CAREER: From Dynamic Algorithms to Fast Optimization and Back
职业:从动态算法到快速优化并返回
- 批准号:
2338816 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Continuing Grant
CRII: RI: Deep neural network pruning for fast and reliable visual detection in self-driving vehicles
CRII:RI:深度神经网络修剪,用于自动驾驶车辆中快速可靠的视觉检测
- 批准号:
2412285 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Standard Grant
Accelerated discovery of ultra-fast ionic conductors with machine learning
通过机器学习加速超快离子导体的发现
- 批准号:
24K08582 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (C)
Mem-Fast Membranes as Enablers for Future Biorefineries: from Fabrication to Advanced Separation Technologies
Mem-Fast 膜作为未来生物精炼的推动者:从制造到先进的分离技术
- 批准号:
EP/Y032004/1 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Research Grant
Model order reduction for fast phase-field fracture simulations
快速相场断裂模拟的模型降阶
- 批准号:
EP/Y002474/1 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Research Grant
SBIR Phase I: An Interplanetary Smallsat for Fast Connectivity, Navigation, and Positioning
SBIR 第一阶段:用于快速连接、导航和定位的行星际小型卫星
- 批准号:
2322390 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Standard Grant
FAST CAR-T: Faster, Adaptive and Scalable Technologies For CAR-T Manufacture
FAST CAR-T:更快、自适应和可扩展的 CAR-T 制造技术
- 批准号:
EP/Z532770/1 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Research Grant
Luminescent Organometallic Complexes with Fast Radiative Rates
具有快速辐射速率的发光有机金属配合物
- 批准号:
2348784 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Continuing Grant
CAREER: Understanding Radiation Belt Electron Fast, Deep Injections in the Inner Magnetosphere
职业:了解辐射带电子在内磁层的快速、深层注入
- 批准号:
2338125 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Continuing Grant
CAREER: Fast coherent and incoherent control of atomic ions in scalable platforms
职业:在可扩展平台中对原子离子进行快速相干和非相干控制
- 批准号:
2338897 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Continuing Grant