Unravelling complex trait architecture using DNA sequence data
使用 DNA 序列数据揭示复杂的性状结构
基本信息
- 批准号:317460274
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:德国
- 项目类别:Research Grants
- 财政年份:2016
- 资助国家:德国
- 起止时间:2015-12-31 至 2020-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Advances in molecular biology have led to the availability of massive collections of genomic data in human, animals, and plants. These data, together with phenotypic and genealogical information on a large number of individuals promise new biological insights on genetic mechanisms controlling complex traits. Despite the constantly increasing size of experimental data sets, one of the most prominent problems of genomic data analysis is that the number of unknown parameters in the statistical models exceeds - often by far - the available sample size (n << p setting). Various Bayesian linear regression models with proper priors (producing shrinkage of coefficients) that can be applied when the number of covariates or predictors is larger than the number of observations have been suggested in the context of genome-wide prediction of genetic values. However, the performance of these methods with respect to inference on model parameters and identification of functional mutations in sequence data is largely unknown. The overall objective of this study is to identify optimal Bayesian regression methods for inference on marker effects in high-dimensional data. We will investigate the sensitivity and Bayesian learning properties of a new generation of models with different prior distribution settings, including different types of mixture distributions, in simulated and experimental data. Whole-genome regression models will be enhanced by biologically driven grouping of markers prior to model fitting. Implementation issues, such as computational effectiveness and behavior of the associated MCMC algorithms will be explored and guidelines for assessing the uncertainty of inferences and the Bayesian sensitivity with respect to different priors used in hierarchical models will be provided. By studying more than 1000 sequenced Arabidopsis thaliana accessions for which high quality phenotypic data are available, the ability of whole-genome regression models to learn about statistical trait architecture (e.g., genomic regions involved, effect sizes, contributions to variance) will be assessed and compared to biological prior knowledge. The results from the project will allow identifying optimal statistical methods to harness the large amount of genomic data which is already available or upcoming for many plant species.
分子生物学的进步已经导致了人类、动物和植物的大量基因组数据的可用性。这些数据,加上大量个体的表型和系谱信息,有望为控制复杂性状的遗传机制提供新的生物学见解。尽管实验数据集的规模不断增加,但基因组数据分析最突出的问题之一是统计模型中未知参数的数量超过了可用的样本大小(n << p设置)。在全基因组遗传值预测的背景下,提出了各种具有适当先验(产生系数收缩)的贝叶斯线性回归模型,当协变量或预测因子的数量大于观测值的数量时,可以应用这些模型。然而,这些方法在模型参数推断和序列数据中功能突变识别方面的性能在很大程度上是未知的。本研究的总体目标是确定最佳的贝叶斯回归方法的推断标记的影响,在高维数据。我们将研究具有不同先验分布设置的新一代模型的灵敏度和贝叶斯学习特性,包括模拟和实验数据中不同类型的混合分布。全基因组回归模型将在模型拟合之前通过生物驱动的标记分组来增强。实施问题,如相关MCMC算法的计算效率和行为将进行探讨,并提供评估推理的不确定性和贝叶斯灵敏度相对于分层模型中使用的不同先验的指导方针。通过研究超过1000个测序的拟南芥种质,其中高质量的表型数据是可用的,全基因组回归模型的能力,以了解统计性状架构(例如,涉及的基因组区域、效应大小、对方差的贡献)将被评估并与生物学先验知识进行比较。该项目的结果将允许确定最佳统计方法,以利用许多植物物种已经可用或即将到来的大量基因组数据。
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Best Prediction of the Additive Genomic Variance in Random-Effects Models
随机效应模型中加性基因组方差的最佳预测
- DOI:10.1534/genetics.119.302324
- 发表时间:2019
- 期刊:
- 影响因子:3.3
- 作者:Schreck;Piepho;Schlather
- 通讯作者:Schlather
Empirical decomposition of the explained variation in the variance components form of the mixed model
混合模型方差分量形式的解释变化的经验分解
- DOI:10.1101/2019.12.28.890061
- 发表时间:2019
- 期刊:
- 影响因子:0
- 作者:Schreck
- 通讯作者:Schreck
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Professor Dr. Martin Schlather其他文献
Professor Dr. Martin Schlather的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Professor Dr. Martin Schlather', 18)}}的其他基金
Estimation of Variograms by Monotone, Conditionally Negative Definite Functions with Applications in Forestry
单调、条件负定函数的变异函数估计及其在林业中的应用
- 批准号:
69219398 - 财政年份:2008
- 资助金额:
-- - 项目类别:
Research Units
相似国自然基金
TPLATE Complex通过胞吞调控CLV3-CLAVATA多肽信号模块维持干细胞稳态的分子机制研究
- 批准号:32370337
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
二甲双胍对于模型蛋白、γ-secretase、Complex I自由能曲面的影响
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
高脂饮食损伤巨噬细胞ndufs4表达激活Complex I/mROS/HIF-1通路参与溃疡性结肠炎研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
利用新型 pH 荧光探针研究 Syntaxin 12/13 介导的多种细胞器互作
- 批准号:92054103
- 批准年份:2020
- 资助金额:87.0 万元
- 项目类别:重大研究计划
S-棕榈酰化新型修饰在细胞自噬中的功能和机制研究
- 批准号:31970693
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
核孔复合体调控细胞核/叶绿体信号交流分子机制的研究
- 批准号:31970656
- 批准年份:2019
- 资助金额:52.0 万元
- 项目类别:面上项目
m6A甲基化酶ZCCHC4结合EIF3复合物调节翻译的机制研究
- 批准号:31971330
- 批准年份:2019
- 资助金额:62.0 万元
- 项目类别:面上项目
线粒体参与呼吸中枢pre-Bötzinger complex呼吸可塑性调控的机制研究
- 批准号:31971055
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
北温带中华蹄盖蕨复合体Athyrium sinense complex的物种分化
- 批准号:31872651
- 批准年份:2018
- 资助金额:60.0 万元
- 项目类别:面上项目
细胞不对称分裂时PAR-3/PAR-6复合物极性聚集的分子机制研究
- 批准号:31871394
- 批准年份:2018
- 资助金额:60.0 万元
- 项目类别:面上项目
相似海外基金
Climate Change Effects on Pregnancy via a Traditional Food
气候变化通过传统食物对怀孕的影响
- 批准号:
10822202 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Naturalistic Social Communication in Autistic Females: Identification of Speech Prosody Markers
自闭症女性的自然社交沟通:语音韵律标记的识别
- 批准号:
10823000 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Role of Frizzled 5 in NK cell development and antiviral host immunity
Frizzled 5 在 NK 细胞发育和抗病毒宿主免疫中的作用
- 批准号:
10748776 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Genetics of Extreme Phenotypes of OSA and Associated Upper Airway Anatomy
OSA 极端表型的遗传学及相关上呼吸道解剖学
- 批准号:
10555809 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Exploring the Collaborative Cross resource to identify different phenotypes of Lyme neuroborreliosis and disease-contributing genetic factors
探索协作交叉资源以确定莱姆神经疏螺旋体病的不同表型和疾病致病遗传因素
- 批准号:
10666026 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Genetic and Functional Mechanisms in Citrate Transporter Disorder associated with SLC13A5
与 SLC13A5 相关的柠檬酸转运蛋白紊乱的遗传和功能机制
- 批准号:
10651203 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Demographic Patterns of Eugenic Sterilization in Five U.S. States: Mixed Methods Investigation of Reproductive Control of the 'Unfit'
美国五个州优生绝育的人口统计模式:“不健康者”生殖控制的混合方法调查
- 批准号:
10640886 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Leveraging pleiotropy to develop polygenic risk scores for cardiometabolic diseases
利用多效性开发心脏代谢疾病的多基因风险评分
- 批准号:
10797389 - 财政年份:2023
- 资助金额:
-- - 项目类别:
DMS/NIGMS 2: Spatial, Multi-Host Petri Net Models for Zoonotic Disease Forecasting
DMS/NIGMS 2:用于人畜共患疾病预测的空间、多主机 Petri 网络模型
- 批准号:
10797423 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Probing the role of heterogeneity in streptococcal interactions
探讨异质性在链球菌相互作用中的作用
- 批准号:
10841244 - 财政年份:2023
- 资助金额:
-- - 项目类别: