Finding Genes in DNA using Machine Learning Algorithms

使用机器学习算法寻找 DNA 中的基因

基本信息

  • 批准号:
    9530462
  • 负责人:
  • 金额:
    $ 21.45万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    1996
  • 资助国家:
    美国
  • 起止时间:
    1996-08-15 至 2000-07-31
  • 项目状态:
    已结题

项目摘要

The automatic and efficient recognition of genes in DNA sequences is now widely recognized as a central problem in computational molecular biology. This research project uses the gene recognition problem in databases of gene sequence data as a driver for research in machine learning. It builds on several promising recent results, investigating decision tree methods, memory-based reasoning, and hidden Markov models. Each of these approaches has particular strengths. Recent research by the PI has found that decision trees can achieve consistently higher accuracy that any previous methods for finding protein coding regions in very short DNA subsequences. Embedding of the decision tree approach in a dynamic programming algorithm can be used to produce a more general system. The techniques discovered to be most effective will be incorporated into a complete gene finding system that can identify genes with high accuracy, augmented with a user-friendly interface, and made freely available to the biology and computer science research communities.
自动高效地识别DNA序列中的基因是目前计算分子生物学中的一个核心问题。本研究项目利用基因序列数据库中的基因识别问题作为机器学习研究的驱动力。它建立在几个有希望的最新结果的基础上,研究了决策树方法、基于记忆的推理和隐马尔可夫模型。这些方法每一种都有其独特的优点。PI最近的研究发现,决策树可以实现比任何以前在非常短的DNA子序列中寻找蛋白质编码区的方法都更高的准确性。将决策树方法嵌入到动态规划算法中可以用来产生更通用的系统。被发现最有效的技术将被整合到一个完整的基因发现系统中,该系统可以高精度地识别基因,并增加了一个用户友好的界面,并向生物学和计算机科学研究界免费提供。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Steven Salzberg其他文献

Towards a Framework for Memory-Based
迈向基于内存的框架
  • DOI:
  • 发表时间:
    1995
  • 期刊:
  • 影响因子:
    0
  • 作者:
    S. Kasif;Steven Salzberg;David Waltz;John Rachlin;D. Aha
  • 通讯作者:
    D. Aha
Managing information for concurrent engineering: Challenges and barriers
  • DOI:
    10.1007/bf02029820
  • 发表时间:
    1990-03-01
  • 期刊:
  • 影响因子:
    1.900
  • 作者:
    Steven Salzberg;Michael Watkins
  • 通讯作者:
    Michael Watkins

Steven Salzberg的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Steven Salzberg', 18)}}的其他基金

RESEARCH-PGR: Algorithms and Tools for Improving Genome Assemblies
RESEARCH-PGR:改进基因组组装的算法和工具
  • 批准号:
    1744309
  • 财政年份:
    2018
  • 资助金额:
    $ 21.45万
  • 项目类别:
    Continuing Grant
Bioinformatics Analysis of Regulatory Sites in Genomic DNA Sequences
基因组 DNA 序列调控位点的生物信息学分析
  • 批准号:
    0234704
  • 财政年份:
    2003
  • 资助金额:
    $ 21.45万
  • 项目类别:
    Standard Grant
A high-speed network connection for genomics research
用于基因组学研究的高速网络连接
  • 批准号:
    0333537
  • 财政年份:
    2003
  • 资助金额:
    $ 21.45万
  • 项目类别:
    Standard Grant
2003 Computational Genomics Conference
2003年计算基因组学会议
  • 批准号:
    0314206
  • 财政年份:
    2003
  • 资助金额:
    $ 21.45万
  • 项目类别:
    Standard Grant
The Fifth Annual Computational Genomics Conference at TIGR, to be held at the Renaissance Harborplace Hotel in Baltimore, MD, November 29, 2001 through December 1, 2001
TIGR 第五届年度计算基因组学会议将于 2001 年 11 月 29 日至 12 月 1 日在马里兰州巴尔的摩的 Renaissance Harbourplace Hotel 举行
  • 批准号:
    0120900
  • 财政年份:
    2001
  • 资助金额:
    $ 21.45万
  • 项目类别:
    Standard Grant
Collaborative Research: Interpolated Markov Models for DNA Sequence Analysis
合作研究:用于 DNA 序列分析的插值马尔可夫模型
  • 批准号:
    9902923
  • 财政年份:
    1999
  • 资助金额:
    $ 21.45万
  • 项目类别:
    Continuing Grant
CISE Research Instrumentation: Distributed Data Mining in Large Databases
CISE 研究仪器:大型数据库中的分布式数据挖掘
  • 批准号:
    9421531
  • 财政年份:
    1995
  • 资助金额:
    $ 21.45万
  • 项目类别:
    Standard Grant
A Proposal to Study the Applicability of Astronomical Image Processing Methods to Low Contrast Digital Images
研究天文图像处理方法对低对比度数字图像的适用性的建议
  • 批准号:
    9520463
  • 财政年份:
    1995
  • 资助金额:
    $ 21.45万
  • 项目类别:
    Standard Grant
Knowledge Discovery for Molecular Biology: Algorithms and Experiments
分子生物学知识发现:算法和实验
  • 批准号:
    9223591
  • 财政年份:
    1993
  • 资助金额:
    $ 21.45万
  • 项目类别:
    Continuing Grant

相似海外基金

SBIR Phase I: Directed evolution of site-specific bacterial transposase genes to alter specificity and efficiency of insertion of large DNA segments into restorable gene fusions
SBIR 第一阶段:位点特异性细菌转座酶基因的定向进化,以改变大 DNA 片段插入可恢复基因融合的特异性和效率
  • 批准号:
    2234291
  • 财政年份:
    2023
  • 资助金额:
    $ 21.45万
  • 项目类别:
    Standard Grant
oPTion-DDR: A randomized phase III trial investigating Platinum and Taxane chemotherapy in metastatic castration resistant prostate cancer patients with alterations in DNA Damage Response (DDR) genes
oPTion-DDR:一项随机 III 期试验,研究铂类和紫杉烷化疗对 DNA 损伤反应 (DDR) 基因改变的转移性去势抵抗性前列腺癌患者的影响
  • 批准号:
    477946
  • 财政年份:
    2023
  • 资助金额:
    $ 21.45万
  • 项目类别:
    Operating Grants
Chromosome Breaks and the DNA Damage Response in Transcribed Genes
转录基因中的染色体断裂和 DNA 损伤反应
  • 批准号:
    MR/X006778/2
  • 财政年份:
    2023
  • 资助金额:
    $ 21.45万
  • 项目类别:
    Research Grant
DNA Methylation Markers, Genes and Breast Cancer Risk
DNA 甲基化标记、基因和乳腺癌风险
  • 批准号:
    10623879
  • 财政年份:
    2022
  • 资助金额:
    $ 21.45万
  • 项目类别:
Chromosome Breaks and the DNA Damage Response in Transcribed Genes
转录基因中的染色体断裂和 DNA 损伤反应
  • 批准号:
    MR/X006778/1
  • 财政年份:
    2022
  • 资助金额:
    $ 21.45万
  • 项目类别:
    Research Grant
Discovery and characterization of clinically actionable germline mutations in DNA damage repair (DDR) pathway genes in lung cancer
肺癌 DNA 损伤修复 (DDR) 通路基因中临床上可操作的种系突变的发现和表征
  • 批准号:
    10632108
  • 财政年份:
    2022
  • 资助金额:
    $ 21.45万
  • 项目类别:
Discovery and characterization of clinically actionable germline mutations in DNA damage repair (DDR) pathway genes in lung cancer
肺癌 DNA 损伤修复 (DDR) 通路基因中临床上可操作的种系突变的发现和表征
  • 批准号:
    10446511
  • 财政年份:
    2022
  • 资助金额:
    $ 21.45万
  • 项目类别:
Determining the role of DNA methylation in the tissue-specific expression of the Na,K-ATPase-Na/H exchanger pH regulatory system genes.
确定 DNA 甲基化在 Na,K-ATPase-Na/H 交换 pH 调节系统基因的组织特异性表达中的作用。
  • 批准号:
    10202996
  • 财政年份:
    2021
  • 资助金额:
    $ 21.45万
  • 项目类别:
Identification of Genes and DNA Methylation Markers for Lung Cancer Risk by Integrating Multi-omics Data
通过整合多组学数据鉴定肺癌风险基因和 DNA 甲基化标记
  • 批准号:
    10331874
  • 财政年份:
    2021
  • 资助金额:
    $ 21.45万
  • 项目类别:
Identification of Genes and DNA Methylation Markers for Lung Cancer Risk by Integrating Multi-omics Data
通过整合多组学数据鉴定肺癌风险基因和 DNA 甲基化标记
  • 批准号:
    10531620
  • 财政年份:
    2021
  • 资助金额:
    $ 21.45万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了