课题基金基金详情
基于MapReduce的非编码RNA“从头预测”识别方法研究
结题报告
批准号:
61370010
项目类别:
面上项目
资助金额:
80.0 万元
负责人:
邹权
依托单位:
学科分类:
F0124.生物电子学与生物信息处理
结题年份:
2017
批准年份:
2013
项目状态:
已结题
项目参与者:
林琛、潘建波、林明霞、陈婧、唐振坤、胡玲玲、陈伟程、胡始昌、毛耀宗
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
客服二维码
微信扫码咨询
中文摘要
非编码RNA识别是理解基因组信息的重要工作之一。但目前的研究还存在识别不准确、软件通用性差以及无法处理大规模数据的缺点。在前期的青年基金研究工作中,我们提出了优化反例训练样本和利用投票机制提高识别准确率。本项目是前期工作的继续。面对规模日益增大的测序数据,本项目利用MapReduce并行计算框架,快速准确地实现非编码RNA的识别和标注。. 本项目的主要工作包括:1. 使用“局部-全局”比对算法提高同源搜索的敏感性,并用MapReduce框架降低时间开销;2. 利用MapReduce和集成投票策略提高大规模不平衡数据的分类效果;3.针对不同种类的非编码RNA研究并开发跨平台、并行的非编码RNA标注系统。. 本项目是青年基金项目的延伸,将使青年基金的研究成果在大规模测序数据中得到应用。本项研究对开拓生物信息学方法、开发实用的计算生物学系统和研究非编码RNA分子功能都具有重要意义。
英文摘要
Non-coding RNA annotation is one of the most important work for understanding genome information. The current software tools are not accurate and easily used enough. Moreover, they can not deal with the scale sequencing data. In my previous NSFC project, we improved the prediction accuracy by selecting high-quality negative samples and employing ensemble classification. This project is the extension of the previous work. We intend to take use of MapReduce platform for the large scale data, and annotate the non-coding RNA accurately and fast.. This project will include three major works. First, we will improve the sensitivity of homologous searching by the "local-global" alignment, which will be implemented by MapReduce for accelerating. Second, the prediction performance will be improved by the ensemble voting strategy, which is also accelerated by MapReduce. Third, we will develop the paralleled non-coding RNA annotation tool, which can run in the multiple operation system.. This project is the extension of my previous NSFC project, and will apply the achievement in the large scale sequencing data. This project is helpful for studying bioinformatics methods, developing computational biology tools and doing research on non-coding RNA.
本项目对非编码RNA的挖掘方法展开研究,并且开发并行化挖掘系统软件。通过4年的工作,课题组对microRNA、tRNA和circleRNA三种重要的非编码RNA研发了一整套成熟的挖掘机制,尤其是提出的优化反例集挖掘microRNA策略得到了多位国际同行的高度评价,2017年Nature子刊论文多次引用和评述了该工作。项目执行期间,课题组以本项目为第一标注共发表了35篇SCI论文,超额完成了预期目标。代表作发表在Briefings in Bioinformatics(IF2015=8.399)、PLoS Computational Biology(IF2015=4.587)、Bioinformatics(IF2015=5.766)等生物信息学领域最高水平的期刊上。在甲藻中发现了超过100条新的miRNA基因,并进行了生物实验验证。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
Identification of cytokine via an improved genetic algorithm
通过改进的遗传算法识别细胞因子
DOI:10.1007/s11704-014-4089-3
发表时间:2015-08
期刊:Frontiers of Computer Science
影响因子:4.2
作者:Zeng Xiangxiang;Yuan Sisi;Huang Xianxian;Zou Quan
通讯作者:Zou Quan
Combining evolutionary information extracted from frequency profiles with sequence-based kernels for protein remote homology detection
将从频率分布中提取的进化信息与基于序列的内核相结合以进行蛋白质远程同源性检测
DOI:10.1093/bioinformatics/btt709
发表时间:2014-02-15
期刊:BIOINFORMATICS
影响因子:5.8
作者:Liu, Bin;Zhang, Deyuan;Chou, Kuo-Chen
通讯作者:Chou, Kuo-Chen
DOI:10.1155/2017/5652041
发表时间:2017
期刊:Biomed Research International
影响因子:--
作者:Zou Quan;Mrozek Dariusz;Ma Qin;Xu Yungang
通讯作者:Xu Yungang
HAlign: Fast multiple similar DNA/RNA sequence alignment based on the centre star strategy
HAlign:基于中心星策略的快速多个相似DNA/RNA序列比对
DOI:10.1093/bioinformatics/btv177
发表时间:2015-08-01
期刊:BIOINFORMATICS
影响因子:5.8
作者:Zou, Quan;Hu, Qinghua;Wang, Guohua
通讯作者:Wang, Guohua
Personalized news recommendation via implicit social experts
通过隐性社会专家进行个性化新闻推荐
DOI:10.1016/j.ins.2013.08.034
发表时间:2014-01-01
期刊:INFORMATION SCIENCES
影响因子:8.1
作者:Lin, Chen;Xie, Runquan;Li, Tao
通讯作者:Li, Tao
利用多序列比对指导16s rRNA的OTU聚类
  • 批准号:
    61771331
  • 项目类别:
    面上项目
  • 资助金额:
    66.0万元
  • 批准年份:
    2017
  • 负责人:
    邹权
  • 依托单位:
国内基金
海外基金