面向复杂生物数据处理的高效计算方法
项目介绍
AI项目解读
基本信息
- 批准号:61232001
- 项目类别:重点项目
- 资助金额:280.0万
- 负责人:
- 依托单位:
- 学科分类:F02.计算机科学
- 结题年份:2017
- 批准年份:2012
- 项目状态:已结题
- 起止时间:2013-01-01 至2017-12-31
- 项目参与者:潘毅; 李宏; 吴方向; 张法; 段桂华; 郭克华; 李建璜; 陈翔; 万晓华;
- 关键词:
项目摘要
The development of genomics and proteomics has provided great chanllenges to the research of bioinformatics. As the development of high throughput biological technology, massive biological data are produced in an explosive way, and the current biological data has many special characteristics, such as, multiple, associative, high-noisy, inaccurate,and incomplete. How to seek an efficient way to solve biological computation problems based on biological data analysis has become the major concerned problem in national strategic needs and major project needs. For very long time, various methods from different fields have been studied to get novel computer algorithms to deal with massive,complicated biological data efficiently, which include heuristic algorithm, approximation method, exact algorithm, artificial intelligence method, parameterized computation method, etc. Much attention has been paid on above several methods either to improve the current methods or to find more efficient methods. The general process solving biological computation problems consists of two steps: get a feasible model for a problem, and then find appropriate methods to solve the problem by model characteristics. It can be seen from current biological problem modeling and solving processes that the characteristics analysis of biological data plays an important role in modeling and solving processes, which sometimes has direct impact on the complexity of the model and the efficiency of the designed algorithm. Therefore, how to efficiently analyze biological data to model and solve biological computation problems becomes a hot research topic in bioinformatics..This project will seek for new computer methods to solve problems in bioinformatics. Firstly, the multiple properties of biological data will be analyzed, and critical parameters which decide the computation complexity of problems will be thoroughly studied. Based on the analysis of biological data and critical parameters, multiple parameter models for biological computation problems will be established. Based on the multiple parameters model built for biological computation problems, this project will make full use of parameterized computation, heuristic, data compression, multiple data merging methods together to solve hot research topics and problems in bioinformatics, for the aim of presenting a systematic methods sloving biological computation problems based on data characteristics. Finally, the project will design related software platform with self-owned intellectual property rights based on the algorithms studied, and apply the software to the diagnose, analysis and therapy of complicated diseases. The research results of this project will be closely related to national strategic needs, and will provide novel idea for analyzing data characteristics and finding efficient computation methods to many fields, especially to many major engineering projects.
基因组学、蛋白组学等领域的发展对现代生命科学研究带来了前所未有的机遇和挑战。如何寻求生物信息学新计算技术解决生命科学领域的国际前沿问题已成为国家重大战略需求和重大工程需求的关键科学问题。本项目将跳出传统计算机算法设计思路,首先分析生物数据的多元特性,挖掘影响问题复杂性的关键参数,刻画生物计算问题的多元模型。然后,基于生物计算问题多元模型,结合参数计算方法、启发式方法、数据压缩方法和多元信息融合方法,解决生物计算中的相关热点和难点问题,建立一套面向生物数据特征的生物计算难解问题系统求解方法。最后,本项目将基于生物计算问题的算法研究成果,建立自主知识产权的相关软件处理平台,并实际应用于复杂疾病的诊断、分析和治疗中。本项目的研究将为复杂生物数据处理提供高效的计算方法,为面向重大工程需求进行数据特征挖掘和高效计算方法的研究提供新思路,推动我国面向实际工程和国家重大需求的高效计算方法的研究和应用。
结项摘要
在本基金的资助下,课题组针对基因组序列分析与组装、蛋白质结构及功能预测、生物网络构建与分析、疾病-miRNA和lncRNA关系预测、生物显微图像重构等复杂生物数据处理中的若干关键问题展开研究,主要成果如下:1. 深入分析了序列数据、蛋白质相互作用数据等各种不同类型生物数据的噪声分布情况,结合生物数据之间的强关联关系研究了生物数据去噪处理的方法;深入挖掘了复杂生物数据自身所固有的特征,为研究面向数据特征的高效计算方法提供了依据;2. 针对新一代测序技术和宏基因组数据,重点研究了短片段拼接、结构变异发现和高阶SNP发现等生物计算问题,利用双端读数分布、insert size分布等特征,设计了基于De Bruijn图的序列组装方法、基于路径扩展的scaffolding方法和基于读数分割策略的gap填充方法以及结构变异发现和高阶SNP发现方法;3. 通过融合转录组、肽标识蛋白质信息以及互作组信息设计了蛋白质鉴定方法;提出了单分子定位和贝叶斯技术相结合的新型活细胞超分辨率显微技术用于蛋白质的精确定位;4.针对静态蛋白质网络分析的若干局限性,通过融合时间序列下的基因表达等数据,提出了新的动态蛋白质网络构建方法,设计了基于蛋白质活性的复合物提炼方法和基于蛋白质网络拓扑特性及多元生物信息的一系列蛋白质复合物挖掘方法;5. 通过融合多相似性网络并基于核贝叶斯矩阵分解、逻辑矩阵分解和随机游走等技术,提出了一系列疾病-miRNA、疾病-lncRNA关系预测方法和药物重定位方法;6. 针对生物显微图像重构的高性能计算问题,提出了一系列生物大分子冷冻电镜图像处理方法、生物大分子冷冻电镜图像重构算法和大规模、大尺度的生物大分子冷冻电镜数据并行处理方法。7. 基于生物计算中若干问题的数据特征,通过挖掘影响问题复杂性的若干关键参数,建立了相关问题的多元参数模型,并给出了多元参数模型的复杂性分析和参数算法设计;8. 在提出的上述方法的基础上设计开发了一系列开源的生物计算软件和web在线服务工具。
项目成果
期刊论文数量(104)
专著数量(2)
科研奖励数量(0)
会议论文数量(37)
专利数量(13)
Disease gene identification by using graph kernels and Markov random fields
使用图核和马尔可夫随机场识别疾病基因
- DOI:10.1007/s11427-014-4745-8
- 发表时间:2014-11-01
- 期刊:SCIENCE CHINA-LIFE SCIENCES
- 影响因子:9.1
- 作者:Chen BoLin;Li Min;Wu FangXiang
- 通讯作者:Wu FangXiang
Improved approximation algorithm for maximum agreement forest of two rooted binary phylogenetic trees
两根二元系统发育树最大一致性森林的改进近似算法
- DOI:10.1007/s10878-015-9921-7
- 发表时间:2016-07-01
- 期刊:JOURNAL OF COMBINATORIAL OPTIMIZATION
- 影响因子:1
- 作者:Shi, Feng;Feng, Qilong;Wang, Jianxin
- 通讯作者:Wang, Jianxin
LDAP: a web server for lncRNA-disease association prediction
LDAP:用于 lncRNA 疾病关联预测的 Web 服务器
- DOI:10.1093/bioinformatics/btw639
- 发表时间:2017-02-01
- 期刊:BIOINFORMATICS
- 影响因子:5.8
- 作者:Lan, Wei;Li, Min;Wang, Jianxin
- 通讯作者:Wang, Jianxin
Prediction of essential proteins based on gene expression programming.
基于基因表达编程的必需蛋白质预测
- DOI:10.1186/1471-2164-14-s4-s7
- 发表时间:2013
- 期刊:BMC genomics
- 影响因子:4.4
- 作者:Zhong J;Wang J;Peng W;Zhang Z;Pan Y
- 通讯作者:Pan Y
Protein Inference from the Integration of Tandem MS Data and Interactome Networks
串联 MS 数据和 Interactome 网络整合的蛋白质推断
- DOI:10.1109/tcbb.2016.2601618
- 发表时间:2017-11-01
- 期刊:IEEE-ACM TRANSACTIONS ON COMPUTATIONAL BIOLOGY AND BIOINFORMATICS
- 影响因子:4.5
- 作者:Zhong,Jiancheng;Wang,Jianxing;Pan,Yi
- 通讯作者:Pan,Yi
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
几种公平的主动队列管理算法的比
- DOI:--
- 发表时间:--
- 期刊:微电子学与计算机,2005,22(7):36-41
- 影响因子:--
- 作者:高文宇;王建新;陈松乔
- 通讯作者:陈松乔
一种保证 TCP 上下行时间公平的新调度算法
- DOI:--
- 发表时间:--
- 期刊:高技术通讯
- 影响因子:--
- 作者:黄家玮;王建新
- 通讯作者:王建新
无线ad hoc网络中基于帧传输效率的拥塞控制方法
- DOI:--
- 发表时间:--
- 期刊:通信学报
- 影响因子:--
- 作者:王建新;廖秋丽;叶进
- 通讯作者:叶进
基于第二代Bandelet变换的图像认证水印算法
- DOI:--
- 发表时间:2010
- 期刊:通信学报
- 影响因子:--
- 作者:刘绪崇;罗永;王建新;汪洁
- 通讯作者:汪洁
基于RED的带宽分配算法
- DOI:--
- 发表时间:--
- 期刊:计算机工程,2005,31(19):49-50,53
- 影响因子:--
- 作者:高文宇;陈松乔;王建新
- 通讯作者:王建新
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
王建新的其他基金
单倍型群体基因组组装及其疾病关联分析方法研究
- 批准号:62350004
- 批准年份:2023
- 资助金额:248.00 万元
- 项目类别:专项项目
三代测序数据组装和模式挖掘基础理论与高效算法
- 批准号:62332020
- 批准年份:2023
- 资助金额:232.00 万元
- 项目类别:重点项目
单倍型群体基因组组装及其疾病关联分析方法研究
- 批准号:62150048
- 批准年份:2021
- 资助金额:95 万元
- 项目类别:国际(地区)合作与交流项目
基于稀疏矩阵填充的生物实体关联预测方法
- 批准号:
- 批准年份:2019
- 资助金额:61 万元
- 项目类别:
复杂生物医学数据处理方法及应用研究
- 批准号:U1909208
- 批准年份:2019
- 资助金额:200 万元
- 项目类别:联合基金项目
面向图类增量问题的参数算法及其应用研究
- 批准号:61672536
- 批准年份:2016
- 资助金额:63.0 万元
- 项目类别:面上项目
饮酒、冲动控制与经理人投资决策
- 批准号:71501193
- 批准年份:2015
- 资助金额:18.0 万元
- 项目类别:青年科学基金项目
难解问题的核心化技术及其应用研究
- 批准号:61073036
- 批准年份:2010
- 资助金额:37.0 万元
- 项目类别:面上项目
多跳无线与有线混合网络中传输控制协议研究
- 批准号:60673164
- 批准年份:2006
- 资助金额:26.0 万元
- 项目类别:面上项目
基于预测的可扩展接纳控制策略研究
- 批准号:90304010
- 批准年份:2003
- 资助金额:33.0 万元
- 项目类别:重大研究计划
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}