基于条件随机域切分模型的基因组词语组合挖掘研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61172099
  • 项目类别:
    面上项目
  • 资助金额:
    60.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0124.生物电子学与生物信息处理
  • 结题年份:
    2015
  • 批准年份:
    2011
  • 项目状态:
    已结题
  • 起止时间:
    2012-01-01 至2015-12-31

项目摘要

本申请从语言学角度,将生物全基因组作为由词语模式组成的序列进行整体分析,利用计算语言学方法结合DNA序列的生物特性,进行全基因组的词语模式挖掘。首先在已有的生物数据库的基础上,将现有的基因组功能位点作为标准词条,深入研究了基于统计的特异频率字符串挖掘、串联重复序列挖掘、候选生物词典构建、基于机器学习的DNA序列最优切分策略研究、词语模式泛化等一系列关键技术并最终建立多物种的层次词语模式词典。在最为关键的序列最优切分算法中,引入了条件随机域模型,综合利用局部、全局特征来挖掘词语切分的最优路径。在模型学习问题上,建立可与之有效映射的英文序列切分模型,利用迁移学习策略解决了DNA序列分析缺乏标准训练数据这一瓶颈问题。.本申请的相关研究成果是全面理解全基因组的结构、功能的重要基础,同时可将现有的大量计算生物学问题从粗粒度的碱基层面的研究提升到词语层面的研究,从而将生命科学的发展起到积极的促进作用。

结项摘要

本申请从语言学角度,对生物全基因组序列进行分词,从而达到“理解”DNA语言的目的。为实现这一目标,本课题组完成了三方面的研究:1)利用英文文本作为模拟数据,深入研究了未知词语特征的前提下,小字符集序列切分的特征选择问题,最终利于边界熵以及整词特征获得了92%的切分准确率;2)我们在已有的生物数据库的基础上,将现有的基因组功能位点作为标准词条,深入研究了基于统计的特异频率字符串挖掘、串联重复序列挖掘、候选生物词典构建、基于条件虽机场模型的DNA序列切分策略研究、基于迁移学习的DNA序列最优切分策略研究、词语模式泛化等一系列关键技术并最终建立了多个适合不同物种的全基因组切分模型;3)探索了DNA词语序列在生物信息学上的应用。我们建立了细菌层次词语模式词典,研究了基于词条的全基因组比对算法及系统进化分析。.本申请实现了语言学角度的DNA序列分词,该研究成果是全面理解全基因组的结构、功能的重要基础。但同时本项目也面临着生物学知识匮乏,算法的结果难以评价及优化的问题。因此本项目的研究将是一个长期过程,将随着生物学、生物信息学、生命科学的领域的发展而逐渐成熟。

项目成果

期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(4)
专利数量(0)
MRS for multi-document summarization by sentence extraction
MRS 通过句子提取进行多文档摘要
  • DOI:
    10.1007/s11235-013-9681-6
  • 发表时间:
    2013-05
  • 期刊:
    Telecommunication Systems
  • 影响因子:
    2.5
  • 作者:
    徐永东;张晓东;权光日;王亚东
  • 通讯作者:
    王亚东
Learning Extraction of Chinese Comparative Sentences for Eva1uatíve Text
学习评估文本的汉语比较句提取
  • DOI:
    10.14257/ijgdc.2016.9.3.07
  • 发表时间:
    2016-03
  • 期刊:
    International Journal of Grid and Distributed Computing
  • 影响因子:
    --
  • 作者:
    Wei Wang;TieJun Zhao;GuoDong Xin
  • 通讯作者:
    GuoDong Xin
Recognizing Comparative Sentences from Chinese Review Texts
识别中文评论文本中的比较句
  • DOI:
    10.14257/ijdta.2014.7.5.03
  • 发表时间:
    2014-10
  • 期刊:
    International Journal of Database Theory and Application
  • 影响因子:
    --
  • 作者:
    Wei Wang;Tiejun Zhao;Guodong Xin;Yongdong Xu
  • 通讯作者:
    Yongdong Xu
基于条件随机域模型的比较要素抽取研究
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    自动化学报
  • 影响因子:
    --
  • 作者:
    王巍;赵铁军;辛国栋;徐永东
  • 通讯作者:
    徐永东
基于HL7的电子病历关键信息抽取技术研究
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    哈尔滨工业大学学报
  • 影响因子:
    --
  • 作者:
    徐永东;权光日;王亚东
  • 通讯作者:
    王亚东

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

压力对挤压铸造AZ91-Ca合金组织与力学性能的影响
  • DOI:
    10.15980/j.tzzz.2017.01.018
  • 发表时间:
    2017
  • 期刊:
    特种铸造及有色合金
  • 影响因子:
    --
  • 作者:
    庞松;朱秀荣;徐永东;任政;刘辰;张潇;赵新兵;张扬
  • 通讯作者:
    张扬
Mg-Gd-Dy-Zr医用镁合金的组织与性能
  • DOI:
    10.15980/j.tzzz.2019.04.003
  • 发表时间:
    2019
  • 期刊:
    特种铸造及有色合金
  • 影响因子:
    --
  • 作者:
    王振林;刘辰;曹召勋;庞松;任政;徐永东;朱秀荣;卓孟川;徐雨露
  • 通讯作者:
    徐雨露
TA2钛动态压缩绝热剪切破坏及有限元模拟
  • DOI:
    --
  • 发表时间:
    2020
  • 期刊:
    兵器材料科学与工程
  • 影响因子:
    --
  • 作者:
    杨阳;庞松;赵枢明;陈小虎;唐盛明;任政;刘燕林1;徐永东;付应乾;董新龙
  • 通讯作者:
    董新龙
基于信息融合的多文档自动文摘技术
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机学报
  • 影响因子:
    --
  • 作者:
    徐永东;王晓龙;徐志明
  • 通讯作者:
    徐志明
造船分段作业场所配置问题研究
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机集成制造系统
  • 影响因子:
    --
  • 作者:
    徐永东;胡仕成
  • 通讯作者:
    胡仕成

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

徐永东的其他基金

基于信息重组的多文档自动文摘技术
  • 批准号:
    60803092
  • 批准年份:
    2008
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码