Composition Patterns in Nucleotide Sequences
核苷酸序列的组成模式
基本信息
- 批准号:0073081
- 负责人:
- 金额:$ 28.93万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2000
- 资助国家:美国
- 起止时间:2000-08-15 至 2004-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
PI: Gary BensonProposal Number: 0073081Institution: Mt. Sinai School of MedicineProject SummaryThis project is an investigation of computational problems that arise for a new type of discrete pattern in DNA sequences, the composition pattern.Composition is a vector quantity describing the frequency of occurrence of each alphabet letter in a particular string. Let S be a string over E.Then, C (S) =(f1; f2; pH j _ j) is the composition of S, wherefore 2 _, fi is the fraction of the characters in S that are i. A composition pattern is a string P = r1r2 _ _ _ rp, where RI represents a composition region i.e. a substring of homogenous composition which differs from that of its surrounding regions. Note that the order of letters in RI is irrelevant, as it has no effect on the composition of RI. To date, algorithms which characterize DNA functional sites have concentrated primarily on identifying what this proposal terms position-specific patterns, such as the consensus sequence or themore flexible, but less specific weight matrix based pattern profile. Unfortunately, position-specific patterns are usually not selective enough to distinguish actual occurrences of a feature from false positives. Too often, when these patterns are used to search for unknown matches, one to several orders of magnitude more false positives than true positives are obtained. The composition pattern is a new approach which embraces an important physical property, the potential for variation in structural conformation (shape) of the DNA double helix, yet does so in the context of a type of discrete pattern which has apparently not been previously explored by the algorithmic community. DNA crystallization studies support the idea that certain dinucleotides base-steps confer specific types of flexibility. Further evidence is provided by studies of intrinsically curved and `kinkable' DNA. Based on these observations, it is suggested here that for conformational flexibility, the order of nucleotides in a sequence may be less important than the effect, which certain nucleotide or dinucleotide base-step biases impart on the sequence as a whole. In support of this assertion is an accumulating body of evidence of important DNA features whose unifying characteristic is composition bias rather than position-specific information. This research project encompasses algorithm development for three related problem areas which form the basis for understanding the functional importance of composition variation in nucleotide sequences and the detection of composition patterns. These areas are:Pattern matching. A composition pattern and sequence are given. Find all occurrences of the pattern in the sequence. Occurrences may be exact or approximate.Pattern detection. A sequence or set of sequences is given. Find all recurring composition patterns. Occurrences may be exact or approximate. The patterns are not specified or only partially specifiedSequence segmentation. A sequence is given. Partition it into statistically distinct regions of homogenous composition. These problems have theoretical interest in their own right, independent of biology and have received almost no attention from the algorithmic community.
PI:加里本森提案编号:0073081机构:Mt. Sinai School of Medicine项目概要该项目是对DNA序列中一种新型离散模式--组成模式--所产生的计算问题的研究。组成是一个描述特定字符串中每个字母出现频率的矢量。设S是E上的一个字符串,则C(S)=(f1; f2; pHj_j)是S的合成,因此2_,fi是S中i个字符的分数。组成图案是串P = r1r2_rp,其中RI表示组成区域,即与其周围区域的组成不同的均匀组成的子串。请注意,RI中字母的顺序是无关紧要的,因为它对RI的组成没有影响。到目前为止,表征DNA功能位点的算法主要集中在识别该提案所称的位置特异性模式,如共识序列或更灵活但不太具体的基于权重矩阵的模式配置文件。不幸的是,特定于位置的模式通常没有足够的选择性来区分特征的实际出现与误报。通常,当这些模式用于搜索未知匹配时,获得的假阳性比真阳性多一到几个数量级。组合物模式是一种新的方法,它包含了一个重要的物理性质,即DNA双螺旋结构构象(形状)的变化潜力,但在一种离散模式的背景下这样做,这种模式显然以前没有被算法界探索过。 DNA结晶研究支持这样一种观点,即某些二核苷酸碱基步骤赋予特定类型的灵活性。对固有弯曲和"扭结" DNA的研究提供了进一步的证据。基于这些观察结果,这里建议,对于构象灵活性,序列中核苷酸的顺序可能不如某些核苷酸或二核苷酸碱基步偏差对整个序列的影响重要。支持这一论断的是一个重要的DNA特征,其统一的特点是组成偏见,而不是位置特定的信息的证据积累机构。该研究项目包括三个相关问题领域的算法开发,这些问题构成了理解核苷酸序列组成变化的功能重要性和组成模式检测的基础。这些领域是:模式匹配。给出了一种合成模式和序列。找到序列中出现的所有模式。发生的可能是精确的或近似的。模式检测。给出一个序列或一组序列。查找所有重复出现的构图模式。发生的情况可以是精确的或近似的。模式未指定或仅部分指定序列分割。给出了一个序列。将其划分为统计上不同的同质组成区域。 这些问题本身就有理论上的意义,独立于生物学,几乎没有受到算法界的关注。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Gary Benson其他文献
Evaluating distance functions for clustering tandem repeats.
评估聚类串联重复的距离函数。
- DOI:
- 发表时间:
2005 - 期刊:
- 影响因子:0
- 作者:
Suyog Rao;Alfredo Rodriguez;Gary Benson - 通讯作者:
Gary Benson
An Alphabet Independent Approach to Two-Dimensional Pattern Matching
一种与字母无关的二维模式匹配方法
- DOI:
10.1137/s0097539792226321 - 发表时间:
1994 - 期刊:
- 影响因子:0
- 作者:
A. Amir;Gary Benson;Martín Farach - 通讯作者:
Martín Farach
Exact Distribution of a Spaced Seed Statistic for DNA Homology Detection
用于 DNA 同源性检测的间隔种子统计量的精确分布
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
Gary Benson;Denise Y. F. Mak - 通讯作者:
Denise Y. F. Mak
Minimal entropy probability paths between genome families
基因组家族之间的最小熵概率路径
- DOI:
- 发表时间:
2004 - 期刊:
- 影响因子:1.9
- 作者:
C. Ahlbrandt;Gary Benson;W. Casey - 通讯作者:
W. Casey
3'-UTR SIRF: A database for identifying clusters of short interspersed repeats in 3' untranslated regions
- DOI:
10.1186/1471-2105-8-274 - 发表时间:
2007-07-30 - 期刊:
- 影响因子:3.300
- 作者:
Benjamin B Andken;In Lim;Gary Benson;John J Vincent;Matthew T Ferenc;Bianca Heinrich;Larissa A Jarzylo;Heng-Ye Man;James O Deshler - 通讯作者:
James O Deshler
Gary Benson的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Gary Benson', 18)}}的其他基金
REU Site: Bioinformatics Research and Interdisciplinary Training Experience in Analysis and Interpretation of Information-Rich Biological Data Sets (REU-BRITE)
REU网站:信息丰富的生物数据集分析和解释的生物信息学研究和跨学科培训经验(REU-BRITE)
- 批准号:
1949968 - 财政年份:2020
- 资助金额:
$ 28.93万 - 项目类别:
Standard Grant
REU Site: Bioinformatics Research and Interdisciplinary Training Experience in Analysis and Interpretation of Information-Rich Biological Data Sets (REU-BRITE)
REU网站:信息丰富的生物数据集分析和解释的生物信息学研究和跨学科培训经验(REU-BRITE)
- 批准号:
1559829 - 财政年份:2016
- 资助金额:
$ 28.93万 - 项目类别:
Continuing Grant
III: Small: Bit-Parallel Algorithms for Sequence Alignment and Applications in Detecting Human Genetic Variation and Bacterial Strain Typing
III:小:序列比对的位并行算法及其在检测人类遗传变异和细菌菌株分型中的应用
- 批准号:
1423022 - 财政年份:2014
- 资助金额:
$ 28.93万 - 项目类别:
Continuing Grant
III:Small:Algorithms for Tandem Repeat Variant Discovery Using Next Generation Sequencing Data
III:Small:使用下一代测序数据发现串联重复变异的算法
- 批准号:
1017621 - 财政年份:2010
- 资助金额:
$ 28.93万 - 项目类别:
Continuing Grant
IGERT: Integrating Computational Science into Research in Biological Networks
IGERT:将计算科学融入生物网络研究
- 批准号:
0654108 - 财政年份:2007
- 资助金额:
$ 28.93万 - 项目类别:
Continuing Grant
SEI(BIO): DNA Inverted Repeats: Sensitive Detection Methods and Research Database
SEI(BIO):DNA 反向重复:灵敏检测方法和研究数据库
- 批准号:
0612153 - 财政年份:2006
- 资助金额:
$ 28.93万 - 项目类别:
Standard Grant
Composition Patterns in Nucleotide Sequences
核苷酸序列的组成模式
- 批准号:
0413463 - 财政年份:2003
- 资助金额:
$ 28.93万 - 项目类别:
Standard Grant
TRDB: A Multi-genome Database of Tandem Repeats
TRDB:串联重复的多基因组数据库
- 批准号:
0413462 - 财政年份:2003
- 资助金额:
$ 28.93万 - 项目类别:
Continuing Grant
TRDB: A Multi-genome Database of Tandem Repeats
TRDB:串联重复的多基因组数据库
- 批准号:
0090789 - 财政年份:2001
- 资助金额:
$ 28.93万 - 项目类别:
Continuing Grant
CAREER: Tandem Repeats: Sequence Comparison and Search Algorithms
职业:串联重复:序列比较和搜索算法
- 批准号:
9623532 - 财政年份:1996
- 资助金额:
$ 28.93万 - 项目类别:
Continuing Grant
相似国自然基金
LEARNS 健康教育模式联合大黄敷脐对胸腰椎骨折后腹胀便秘的疗效研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于路网效益提升的湖北高速公路动态差异化收费模式研究
- 批准号:JCZRLH202500136
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
区域内骨质疏松连续性药物治疗管理的模式构建与实证研究
- 批准号:JCZRLH202500562
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
鄂西二叠系层序演化模式及其变异机理
- 批准号:JCZRYB202501538
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
献血者血糖异常筛查及LSM干预模式介导的效果研究
- 批准号:JCZRYB202501541
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
智驾模式下汽车乘员晕车测评与智能治理方法研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
山地城市排水管网系统运营提质增效及智慧管控模式下的运营成效考核评估机制研究 ——以重庆为例
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
产业价值网视角下重庆新能源汽车跨境出 口商业模式创新研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
“双轮驱动”重庆林地资源价值实现机理研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
万达开现代化生态灌区建设与管理新模式研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
相似海外基金
Spatiotemporal dynamics of acetylcholine activity in adaptive behaviors and response patterns
适应性行为和反应模式中乙酰胆碱活性的时空动态
- 批准号:
24K10485 - 财政年份:2024
- 资助金额:
$ 28.93万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Collaborative Research: Unraveling the phylogenetic and evolutionary patterns of fragmented mitochondrial genomes in parasitic lice
合作研究:揭示寄生虱线粒体基因组片段的系统发育和进化模式
- 批准号:
2328117 - 财政年份:2024
- 资助金额:
$ 28.93万 - 项目类别:
Standard Grant
Uncovering the evolutionary patterns of the Aculeata stinger
揭示 Aculeata 毒刺的进化模式
- 批准号:
24K18174 - 财政年份:2024
- 资助金额:
$ 28.93万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Illuminating patterns and processes of water quality in U.S. rivers using physics-guided deep learning
使用物理引导的深度学习阐明美国河流的水质模式和过程
- 批准号:
2346471 - 财政年份:2024
- 资助金额:
$ 28.93万 - 项目类别:
Continuing Grant
Collaborative Research: Can Irregular Structural Patterns Beat Perfect Lattices? Biomimicry for Optimal Acoustic Absorption
合作研究:不规则结构模式能否击败完美晶格?
- 批准号:
2341950 - 财政年份:2024
- 资助金额:
$ 28.93万 - 项目类别:
Standard Grant
Collaborative Research: Unraveling the phylogenetic and evolutionary patterns of fragmented mitochondrial genomes in parasitic lice
合作研究:揭示寄生虱线粒体基因组片段的系统发育和进化模式
- 批准号:
2328119 - 财政年份:2024
- 资助金额:
$ 28.93万 - 项目类别:
Standard Grant
Effects of Environmental Change on Microbial Self-organized Patterns in Antarctic Lakes
环境变化对南极湖泊微生物自组织模式的影响
- 批准号:
2333917 - 财政年份:2024
- 资助金额:
$ 28.93万 - 项目类别:
Standard Grant
AGS-PRF: Understanding Historical Trends in Tropical Pacific Sea Surface Temperature Patterns
AGS-PRF:了解热带太平洋海面温度模式的历史趋势
- 批准号:
2317224 - 财政年份:2024
- 资助金额:
$ 28.93万 - 项目类别:
Fellowship Award
Asymptotic patterns and singular limits in nonlinear evolution problems
非线性演化问题中的渐近模式和奇异极限
- 批准号:
EP/Z000394/1 - 财政年份:2024
- 资助金额:
$ 28.93万 - 项目类别:
Research Grant
Collaborative Research: Linking carbon preferences and competition to predict and test patterns of functional diversity in soil microbial communities
合作研究:将碳偏好和竞争联系起来,预测和测试土壤微生物群落功能多样性的模式
- 批准号:
2312302 - 财政年份:2024
- 资助金额:
$ 28.93万 - 项目类别:
Standard Grant