基于DNA理化特性的真核生物启动子计算识别方法研究
项目介绍
AI项目解读
基本信息
- 批准号:31401136
- 项目类别:青年科学基金项目
- 资助金额:20.0万
- 负责人:
- 依托单位:
- 学科分类:C0608.生物数据资源与分析方法
- 结题年份:2017
- 批准年份:2014
- 项目状态:已结题
- 起止时间:2015-01-01 至2017-12-31
- 项目参与者:张兰兰; 李振伟; 袁红瑛; 冯文坡; 郭静玉;
- 关键词:
项目摘要
The project is based on the fact that eukaryotic promoters have special physicochemical and conformational properties, and aims to establish a new eukaryotic promoter prediction model by using several important machine learning methods, such as artificial neural network, Gaussian mixture model and Bayesian classifier, and hopefully improve the prediction accuracy and the model’s university. The innovation of this project lies in introducing for the first time the idea that “the biological function of eukaryotic promoters is realized through its special physicochemical structure” into the modeling process. In addition to the canonical motif features, the sequence context features and the DNA physicochemical features will be adopted to capture the underlying physicochemical and conformational characteristics of eukaryotic promoters. We will also make some alterations on the architecture of the prediction model so that each kind of features will play a better role in distinguishing promoters from non-promoters. To construct a generic model for most eukaryotes, we will select DNA data from several eukaryotic species as training samples. By these measures, we hope to solve the problems existing in the current promoter prediction tools, such as the excessive dependence on the DNA sequence composition information or being only effective to some specific species. The project is of great importance in finding the hidden regularities that distinguish promoters and non-promoters and generating more effective encoding schemes for similar bioinformatics problems, and is also of considerable referential value to some gene prediction issues, such as the accurate segmentation of exons and introns and the precise positioning of the transcription start sites.
本项目拟以真核生物启动子具有独特的理化和结构性质为突破口,采用机器学习领域的人工神经网络、高斯混合模型、贝叶斯分类器等方法建立真核生物启动子预测模型,提高启动子预测的准确率和模型的通用性。本项目创新点在于,将“真核生物启动子的生物学功能是通过其独特的理化结构来实现”这一思想引入建模过程,在使用经典序列特征的基础上拟增加序列上下文特征和DNA理化特征,捕捉启动子序列隐含的理化与结构特性,并在预测模型各层结构上做合理改动,使各种特征发挥更充分的区分作用,在选取多个物种作为训练样本的基础上,建立可靠的共识模型,解决以往预测工具过分依赖DNA序列组成信息以及仅对特定物种有效等问题。本项目的开展对寻找区分启动子数据与非启动子数据的规律具有重要意义,为此类生物分类问题提供更有效的编码理论,同时对基因预测中外显子内含子界限准确分割问题、转录起始位点的准确定位都具有重要的借鉴价值。
结项摘要
针对真核生物启动子计算预测存在过分依赖DNA序列组成信息以及仅对特定物种有效等问题,本项目在统计分析多种真核生物启动子区域的理化和结构特性的基础上,将DNA理化结构属性引入启动子预测,结合传统的序列特征,采用人工神经网络建立真核生物启动子预测模型。.主要研究内容包括:(1)样本集序列特征、上下文特征和理化结构特征的提取。(2)10种真核生物启动子区域的13项理化与结构特性分析。(3)建立二级结构的启动子预测模型,在模型的第一级上,分别构建基于序列特征、上下文特征、理化特征的打分函数,所得分数作为第二级神经网络的输入,模型经训练后可以对新输入的未知序列进行评判。(4)实现了基于BP神经网络、LVQ神经网络、FKLVQ神经网络的真核启动子预测模型,在相同阈值和测试样本集的条件下取得了优于一些主流启动子预测模型的结果。.重要研究结果包括:(1)10种真核生物的核心启动子在[-50, -20]区域以及转录起始位点(TSS)上均存在独特的理化结构特征,其中人类和小家鼠的核心启动子理化特征谱高度相似,而其他物种的核心启动子理化特征谱也有显著的特征,但同时有一定的物种间差异。(2)对于序列特征,用五联体η值编码法描述并建立PWM打分函数;对于上下文特征,采用Ohler等人提出的插值马尔科夫链实现了描述和打分;对于理化结构特征,选取启动子序列[-149, +50]片段,转化为13×150的特征向量,建立了基于向量欧氏距离的打分函数。(3)将本课题所建立的启动子预测模型与三个主流启动子预测软件进行了比较。.关键数据:获得了多个物种核心启动子的DNA理化特征谱,完成了二级结构启动子预测模型的训练与测试,获得模型在多项指标(敏感性、特异性、阳性预测率、相关系数、ROC曲线)上的表现值。.科学意义:用模式识别方法实现了单个启动子微弱DNA理化结构特征的捕捉,通过二级结构启动子预测模型实现多特征整合,提高了启动子预测的准确率。
项目成果
期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(1)
应用CMA技术诊断染色体不平衡易位1例
- DOI:10.15926/j.cnki.issn1672-688x.2017.04.016
- 发表时间:2017
- 期刊:河南科技大学学报(医学版)
- 影响因子:--
- 作者:杨曦;黄伟伟;李裕和
- 通讯作者:李裕和
微阵列在22q11.2微缺失综合征诊断和产前诊断中的应用
- DOI:--
- 发表时间:2015
- 期刊:河南科技大学学报(医学版)
- 影响因子:--
- 作者:黄伟伟;卢建;杨曦;陈秋平;刘舒;尹爱华
- 通讯作者:尹爱华
Design of tunable surface mode waveguide based on photonic crystal composite structure using organic liquid
基于有机液体光子晶体复合结构的可调谐表面模式波导设计
- DOI:10.1088/1674-1056/26/6/064209
- 发表时间:2017-06
- 期刊:Chinese Physics B
- 影响因子:1.7
- 作者:Lan-lan Zhang;Wei Liu;Ping Li;Xi Yang;Xu Cao
- 通讯作者:Xu Cao
17p11.2微缺失微重复:Smith-Magenis综合征和Potocki-Lupski综合征
- DOI:10.13470/j.cnki.cjpd.2017.03.001
- 发表时间:2017
- 期刊:中国产前诊断杂志(电子版)
- 影响因子:--
- 作者:黄伟伟;周伟宁;卢建;李怡;罗晓辉;杨曦
- 通讯作者:杨曦
应用aCGH技术建立胚胎植入前遗传学筛查
- DOI:10.13470/j.cnki.cjpd.2016.03.004
- 发表时间:2016
- 期刊:中国产前诊断杂志(电子版)
- 影响因子:--
- 作者:黄伟伟;卢建;董云巧;陈创奇;杨曦;尹爱华
- 通讯作者:尹爱华
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
脂质自由基诱导氧化对花生蛋白功能特性的影响
- DOI:10.13995/j.cnki.11-1802/ts.023609
- 发表时间:2020
- 期刊:食品与发酵工业
- 影响因子:--
- 作者:杨曦;程群;刘江;陈琼;王振兴;张雪春;孙健
- 通讯作者:孙健
黑米花青素酶法提取工艺优化及颜色稳定性测定
- DOI:10.12677/hjfns.2019.82016
- 发表时间:2019
- 期刊:食品与营养科学
- 影响因子:--
- 作者:杨曦;孙汉巨;涂李军;何述栋
- 通讯作者:何述栋
辐射法制备Pd掺杂碳气凝胶粉末
- DOI:--
- 发表时间:2013
- 期刊:强激光与粒子束
- 影响因子:--
- 作者:钟铭龙;黄玮;付志兵;杨曦;刘西川;唐永建;王朝阳
- 通讯作者:王朝阳
补肾活血胶囊介导Hedgehog信号通路调控大鼠骨髓间充质干细胞成骨成脂分化
- DOI:--
- 发表时间:2022
- 期刊:中国组织工程研究
- 影响因子:--
- 作者:梁学振;杨曦;李嘉程;骆帝;许波;李刚
- 通讯作者:李刚
Fabry 病患者心肾损害的临床特点及相关因素
- DOI:--
- 发表时间:2019
- 期刊:中华肾病研究电子杂志
- 影响因子:--
- 作者:杨曦;谢院生;米悦;李清刚;蔡广研;陈香美
- 通讯作者:陈香美
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}