多倍体单体型从头组装算法研究
项目介绍
AI项目解读
基本信息
- 批准号:61772197
- 项目类别:面上项目
- 资助金额:63.0万
- 负责人:
- 依托单位:
- 学科分类:F0213.生物信息计算与数字健康
- 结题年份:2021
- 批准年份:2017
- 项目状态:已结题
- 起止时间:2018-01-01 至2021-12-31
- 项目参与者:姜涛; 钟坚成; 周建宇; 熊袁鹏; 叶云洋; 彭哲也; 周佩霞; 唐紫珺; 喻昕;
- 关键词:
项目摘要
Some economically important plants have more than two copies of each chromosome. Constructing the DNA sequence of each copy of chromosome by DNA sequencing, i.e. haplotype assembly, is valuable to crop improvement. Current algorithms of haplotype assembly for polyploids have to align the DNA reads to reference genomes and cannot be applied to the polyploids without known reference genomes. .The project focuses on algorithms of haplotype assembly for polyploids without known reference genomes based on DNA reads from multiple sequencing platforms. The project will use a De Bruijn graph to construct high reliable contigs from short reads with a low error rate, and use contig-based alignment, cluster analysis and machine learning to correct the sequencing errors of reads. Then local assemblies of the contigs and the related reads will be conducted via overlap-extension approaches. Based on the information provided by long reads, paired-end reads, local assemblies and contigs, we will propose haplotype assembly optimal models to deal with the challenge caused by the large and rich repeats of polyploid plant genomes and the fact that difference ratios varies much between different haplotype pairs. Furthermore, we will combine parameterized computation, dynamic programming, advanced graph algorithm and other algorithm designing techniques, design fast and effective algorithms to solve the optimal models, and construct the DNA sequence for each haplotype. Efficient and accurate algorithms of de novo haplotype assembly will prompt genome sequencing of polyploids.
一些重要经济作物的体细胞有多套染色体组,利用测序技术确定每套染色体的DNA序列,即单体型组装,对作物改良有重要意义。当前多倍体单体型组装算法需要把测序读段联配到参考基因组上,无法应用于参考基因组未知的多倍体。.本课题研究无需参考基因组序列、融合多平台测序数据的多倍体单体型从头组装算法。本课题将基于De Bruijn图在错误率低的短读段数据上构建可信度高的contig集,通过基于contig的联配,用聚类分析、机器学习等手段进行读段纠错;用重叠-扩展方式对contig及相关读段进行局部组装,在长读段、paired-end读段、局部组装和contig数据基础上针对多倍体植物基因组重复率高、各单体型对之间差异率明显不同的特征建立优化模型;结合参数计算、动态规划和高级图算法等技术设计快速有效求解算法,构建各单体型的DNA序列。高效精确的多倍体单体型从头组装算法将促进多倍体生物全基因组测序工程。
结项摘要
一些重要经济作物的体细胞有多套染色体组,利用测序技术确定每套染色体的DNA序列, 即单体型组装,对作物改良有重要意义。本课题主要研究无需参考基因组序列、融合多平台测序数据的多倍体单体型从头组装算法。本课题对各主流测序平台上异源多倍体基因组序列真实数据进行了各方面的统计分析,通过对序列数据特征的提取,设计出了能根据测序平台相关参数生成与真实数据有相同特征的模拟数据的生成器。提出基于拓扑结构和相关读段覆盖为依据的 contig 的可信度评价指标,设计基于De Bruijn图的contig组装算法。通过对各主流测序平台上异源多倍体基因组序列真实数据进行统计分析完成了序列数据特征的提取,对异源多倍体基因组序列的组装框架进行了初步的设计,提出了基于第二代测序技术的短序列对错误率较高的长序列进行纠错,利用纠错后的长序列进行组装的算法。利用近年来提出的一种有效的高精度scaffolding方法光学作图(Optimal mapping),本项目提出了一个新颖的光学作图scaffolding方法OMGS(Optical Map-based Genome Scaffolding) ,一次能接收多个optimal map,设计了高效的算法求解scaffolding中的连续性和正确性的优化问题。项目组还对微生物-疾病互作、lncRNA-蛋白质异构体互作、蛋白质异构体功能预测、等相关问题进行了研究,利用已知的疾病-微生物关联网络,通过集成疾病相似性和微生物相似性,提出了二部图推荐算法预测新的疾病-微生物关联;根据基因序列和表达数据提出了lncRNA-蛋白质异构体交互预测、蛋白质异构体功能预测的深度学习方法。
项目成果
期刊论文数量(18)
专著数量(0)
科研奖励数量(0)
会议论文数量(2)
专利数量(0)
机器学习方法在基因交互作用探测中的研究进展
- DOI:--
- 发表时间:2018
- 期刊:遗传
- 影响因子:--
- 作者:彭哲也;唐紫珺;谢民主
- 通讯作者:谢民主
Constructing tissue-specific transcriptional regulatory networks via a Markov random field
通过马尔可夫随机场构建组织特异性转录调控网络
- DOI:10.1186/s12864-018-5277-6
- 发表时间:2018-12-31
- 期刊:BMC GENOMICS
- 影响因子:4.4
- 作者:Ma,Shining;Jiang,Tao;Jiang,Rui
- 通讯作者:Jiang,Rui
Highly sensitive and tunable terahertz biosensor based on optical Tamm states in graphene-based Bragg reflector
基于石墨烯布拉格反射器中光学Tamm态的高灵敏度和可调谐太赫兹生物传感器
- DOI:10.1016/j.rinp.2019.102779
- 发表时间:2019-12
- 期刊:Results in Physics
- 影响因子:5.3
- 作者:Yunyang Ye;Minzhu Xie;Jiao Tang;Jianxing Ouyang
- 通讯作者:Jianxing Ouyang
DIMDRP: A double iteration method for drug response prediction
DIMDRP:药物反应预测的双重迭代方法
- DOI:10.1109/access.2019.2942217
- 发表时间:2019
- 期刊:IEEE Access
- 影响因子:3.9
- 作者:Jianxing Ouyang;Minzhu Xie;Xinqiu Liu
- 通讯作者:Xinqiu Liu
OMGS: Optical Map-Based Genome Scaffolding
OMGS:基于光学图谱的基因组支架
- DOI:10.1089/cmb.2019.0310
- 发表时间:2019-12-03
- 期刊:JOURNAL OF COMPUTATIONAL BIOLOGY
- 影响因子:1.7
- 作者:Pan, Weihua;Jiang, Tao;Lonardi, Stefano
- 通讯作者:Lonardi, Stefano
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
一种基于Stirling图枚举算法的分球入盒问题求解
- DOI:--
- 发表时间:2017
- 期刊:计算机应用与软件
- 影响因子:--
- 作者:彭哲也;谢民主
- 通讯作者:谢民主
两位点疾病模型的快速参数求解算法
- DOI:--
- 发表时间:2012
- 期刊:计算机工程
- 影响因子:--
- 作者:谢民主;刘新求;杨洋
- 通讯作者:杨洋
复杂疾病模型快速参数求解算法
- DOI:--
- 发表时间:2012
- 期刊:计算机工程与应用
- 影响因子:--
- 作者:谢民主;杨洋
- 通讯作者:杨洋
单体型组装最大片段割参数化精确算法
- DOI:--
- 发表时间:--
- 期刊:小型微型计算机系统
- 影响因子:--
- 作者:谢民主;罗锋;唐烽
- 通讯作者:唐烽
有Mate-Pairs的个体单体型MSR问题的参数化算法
- DOI:--
- 发表时间:--
- 期刊:软件学报
- 影响因子:--
- 作者:谢民主;陈建二;王建新
- 通讯作者:王建新
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
谢民主的其他基金
全基因组关联分析基因交互作用探测算法研究
- 批准号:61370172
- 批准年份:2013
- 资助金额:73.0 万元
- 项目类别:面上项目
新一代测序技术下单体型组装问题计算模型和算法研究
- 批准号:61070145
- 批准年份:2010
- 资助金额:32.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}