预测未知的潜在病毒基因序列的研究与传染病预测平台

批准号:
91746119
项目类别:
重大研究计划
资助金额:
60.0 万元
负责人:
丘成栋
依托单位:
学科分类:
C0609.生物大数据解析
结题年份:
2020
批准年份:
2017
项目状态:
已结题
项目参与者:
杨广文、龚海鹏、高峰、吴琦、刘津平、田昆、裴少君、赵鑫、董睿
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
从2002年的SARS到2014年的埃博拉,病毒性传染病严重危害着人类的健康和国家社会的发展。但由于病毒基因的变异速度快,使得传染病的预防具有滞后性,所以如何利用已知的病毒基因序列来提前获得未知病毒的基因序列,从而进行提前预防便是传染病研究的重点。生物上,多数是采用基因重组技术从而获得新的病毒基因序列,但整个实验过程耗时耗力,因此不能进行快速大量的预测。本项目基于现有的病毒基因库,利用自然向量法将对未知病毒的基因序列的预测转化为数学问题,从而利用大数据运算算法对其进行解决,并且基于提出的算法建立一个传染病预测平台。相比于生物方法,本项目致力于利用大数据计算平台对未知病毒基因序列进行预测,大大节约了时间与人力,同时可以对生物实验进行辅助,从而更精确更快速的对病毒性传染病进行提前预防。
英文摘要
From the SARS outbreak in 2002 to Ebola in 2014, viral infectious diseases seriously endanger human health and the development of the country. However, the mutation of viral genes makes the prevention of infectious diseases not timely enough. so how to make use of the known virus gene sequences to find the new virus gene sequences is the key to prevent infectious disease in advance. Biological experiment always use gene recombination techniques to obtain new sequences of viral genes, but the whole process was time-consuming and could not be predicted quickly. This project is based on the existing virus gene library, and uses the natural vector method to transform the prediction of the gene sequence of unknown virus into a mathematical problem, so that it can be solved by the large data computing algorithm. Compared to the biological method, this project is committed to using a large data computing platform to predict gene sequence of unknown virus. This algorithm greatly saves manpower and time, and can be used in biological experiments, thus more accurate for viral infectious diseases prevention in advance.
2002年的非典,2014年的埃博拉以及2019年的新型冠状病毒,病毒性传染病严重危害着人类的生命健康和国家社会的经济发展,尤其是今年的新型冠状病毒,给全球敲响了重视传染病预防的警钟。但由于病毒种类繁多,变异速度快,这使得传染病的预防变得非常困难,并且具有滞后性,所以如何能够提前获得大量潜在的未知病毒的基因序列,从而研究其毒性,传播,进行提前预防,便是传染病研究的一大重点。生物上,多数是采用基因重组技术研究病毒的变异株,或者从动物体中采集分离病毒株,但整个实验过程耗时耗力,因此不能进行快速大量的预测。本项目基于现有的病毒基因库,收集公开数据库中所有的病毒全基因组序列,计算其自然向量,存储建立了自然向量病毒基因库 ‘VirusDB’,在此基础上力求开发一个高效的预测潜在未知病毒的数学算法模型。研究过程中,我们主要得到了以下三个重要结果:.1. 构建了病毒基因空间,定义了病毒基因空间的一个新度量,并在病毒科和属的水平验证了凸包原理,从而确认病毒基因空间可等价一个32维欧氏空间。.2. 开发了适用于超算平台的,基于自然向量法和凸包原理对潜在未知病毒的基因序列的预测算法,并在HIV病毒和新冠病毒中进行了初步的应用。.3. 进一步改进和完善了自然向量法,并将方法推广应用到细菌动物等基因组以及蛋白质组。.我们的自然向量方法是一种高效的降维方法,相比于传统的生物方法,可以大大节约了时间与人力,未来可以对生物实验进行辅助,从而更精确更快速的对病毒性传染病进行提前预防,并且可以用于其他高维的数据。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
Analysis of the Hosts and Transmission Paths of SARS-CoV-2 in the COVID-19 Outbreak
COVID-19 爆发中 SARS-CoV-2 的宿主和传播路径分析。
DOI:10.3390/genes11060637
发表时间:2020-06-01
期刊:GENES
影响因子:3.5
作者:Dong, Rui;Pei, Shaojun;Yau, Stephen S-T
通讯作者:Yau, Stephen S-T
DOI:10.1038/s41598-020-78465-1
发表时间:2020-12-10
期刊:Scientific reports
影响因子:4.6
作者:Tian K;Zhao X;Wan X;Yau SS
通讯作者:Yau SS
A novel alignment-free method for HIV-1 subtype classification
一种新的 HIV-1 亚型分类免比对方法
DOI:10.1016/j.meegid.2019.104080
发表时间:2020-01-01
期刊:INFECTION GENETICS AND EVOLUTION
影响因子:3.2
作者:He, Lily;Dong, Rui;Yau, Stephen S-T
通讯作者:Yau, Stephen S-T
Inverted repeats in coronavirus SARS-CoV-2 genome and implications in evolution
冠状病毒 SARS-CoV-2 基因组中的反向重复序列及其对进化的影响
DOI:10.4310/cis.2021.v21.n1.a6
发表时间:2020-11
期刊:Communications in Information and Systems
影响因子:0.9
作者:Changchuan Yin;Stephen S.-T. Yau
通讯作者:Stephen S.-T. Yau
RDb(2)C2: an improved method to identify the residue-residue pairing in β strands.
RDb(2)C2:一种识别β链中残基-残基配对的改进方法。
DOI:10.1186/s12859-020-3476-z
发表时间:2020
期刊:BMC Bioinformatics
影响因子:3
作者:Shao Di;Mao Wenzhi;Xing Yaoguang;Gong Haipeng
通讯作者:Gong Haipeng
病毒基因组的几何空间及其在病毒特别是新冠病毒中的应用
- 批准号:12171275
- 项目类别:面上项目
- 资助金额:50万元
- 批准年份:2021
- 负责人:丘成栋
- 依托单位:
奇点,李代数,非线性滤波中的几何应用
- 批准号:11961141005
- 项目类别:国际(地区)合作与交流项目
- 资助金额:175万元
- 批准年份:2019
- 负责人:丘成栋
- 依托单位:
复解析簇的局部和整体问题研究
- 批准号:11531007
- 项目类别:重点项目
- 资助金额:230.0万元
- 批准年份:2015
- 负责人:丘成栋
- 依托单位:
关于有限维非线性滤波分类和多项式滤波问题的研究
- 批准号:11471184
- 项目类别:面上项目
- 资助金额:80.0万元
- 批准年份:2014
- 负责人:丘成栋
- 依托单位:
病毒基因空间几何算法研究和对新病毒威胁快速探测及预警
- 批准号:31271408
- 项目类别:面上项目
- 资助金额:60.0万元
- 批准年份:2012
- 负责人:丘成栋
- 依托单位:
国内基金
海外基金
