Methods to enable robust and efficient use of genetic summary data
能够稳健、高效地使用遗传摘要数据的方法
基本信息
- 批准号:10462613
- 负责人:
- 金额:$ 40.8万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2020
- 资助国家:美国
- 起止时间:2020-09-01 至 2025-06-30
- 项目状态:未结题
- 来源:
- 关键词:BioconductorDataData AnalysesData SetDatabasesDiseaseFrequenciesGeneticGenetic Predisposition to DiseaseGenetic ResearchGenomeGenotypeHealthHeterogeneityIndividualInternetLeadMethodsModelingRare DiseasesResourcesTechniquesTestingcase controlcausal variantdata resourcegenetic elementgenetic variantgenome wide association studygenomic datainnovationinsightpolygenic risk scoreprecision medicinestatistics
项目摘要
Abstract
Publiclyavailable genetic summary data canhave high utility for providing insight into genetic etiology
of health and disease. Databases of genotype frequencies, such as the genome Aggregation Database
(gnomAD), are used to prioritize putative causal variants and, more recently, as pseudo-controls in
case-control analysis. Genome Wide Association Study (GWAS) test statistics are used in a variety of
secondary data analyses including polygenic risk scores (PRS), genetic correlation analysis, and fine
mapping of causal variants. Compared with individual level data, genetic summary data often has fewer
barriers in access, promoting broad use of these valuable data resources. The availability and use of
summary genetic data is often not equitable across all ancestral groups, especially for understudied
ancestral groups that have little to no representation within these resources. Furthermore,
heterogeneity within the summary data can lead to confounding and reduced power for case-control
analysis, incorrect prioritization of putative causal variants for rare diseases, and reduced accuracy for
polygenic risk scores. I develop robust and efficient methods to appropriately use genetic summary
data while estimating, modeling, and harnessing the heterogeneity within. My methods coalesce around
a unifying framework where I flip the paradigm of genetic and genomic data treating the genetic variant
or element as the observational unit by which we analyze the data rather than the individual. This
simple, yet innovative paradigm shift enables the use of classical statistical techniques and the creation
of methods that detect, adjust for, and even use heterogeneity within summary level data. To enable
broad and equitable use of our methods, we will create publicly available R packages compatible with
Bioconductor and Shiny Apps for interactive internet use.
摘要
公开可用的遗传总结数据对于提供遗传病因学见解具有很高的实用性
健康和疾病的关系。基因型频率数据库,如基因组聚合数据库
(gnomAD),用于优先考虑假定的因果变异,最近,作为伪对照,
病例对照分析全基因组关联研究(GWAS)检验统计量用于各种
二次数据分析,包括多基因风险评分(PRS),遗传相关性分析和精细
因果变量的映射。与个体水平的数据相比,遗传学概要数据往往较少
在获取方面的障碍,促进这些宝贵的数据资源的广泛使用。的供应和使用
摘要遗传数据在所有祖先群体中往往是不公平的,特别是对于研究不足的群体,
在这些资源中几乎没有代表性的祖先群体。此外,委员会认为,
汇总数据中的异质性可导致混杂和病例对照功效降低
分析,罕见疾病的假定因果变异的优先顺序不正确,
多基因风险评分。我开发了强大而有效的方法来适当地使用遗传总结
数据,同时估计、建模和利用内部的异质性。我的方法结合了
一个统一的框架,我翻转了遗传和基因组数据的范式,
或者元素作为我们分析数据的观察单位,而不是个人。这
简单,但创新的范式转变,使使用经典的统计技术和创造
检测、调整甚至使用汇总级数据中的异质性的方法。使
广泛和公平地使用我们的方法,我们将创建公开可用的R软件包,
Bioconductor和闪亮的应用程序用于交互式互联网使用。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Audrey E Hendricks其他文献
Audrey E Hendricks的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Audrey E Hendricks', 18)}}的其他基金
Methods to enable robust and efficient use of genetic summary data
能够稳健、高效地使用遗传摘要数据的方法
- 批准号:
10251150 - 财政年份:2020
- 资助金额:
$ 40.8万 - 项目类别:
Methods to enable robust and efficient use of genetic summary data
能够稳健、高效地使用遗传摘要数据的方法
- 批准号:
10653969 - 财政年份:2020
- 资助金额:
$ 40.8万 - 项目类别:
相似国自然基金
Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:合作创新研究团队
Data-driven Recommendation System Construction of an Online Medical Platform Based on the Fusion of Information
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:外国青年学者研究基金项目
Development of a Linear Stochastic Model for Wind Field Reconstruction from Limited Measurement Data
- 批准号:
- 批准年份:2020
- 资助金额:40 万元
- 项目类别:
基于Linked Open Data的Web服务语义互操作关键技术
- 批准号:61373035
- 批准年份:2013
- 资助金额:77.0 万元
- 项目类别:面上项目
Molecular Interaction Reconstruction of Rheumatoid Arthritis Therapies Using Clinical Data
- 批准号:31070748
- 批准年份:2010
- 资助金额:34.0 万元
- 项目类别:面上项目
高维数据的函数型数据(functional data)分析方法
- 批准号:11001084
- 批准年份:2010
- 资助金额:16.0 万元
- 项目类别:青年科学基金项目
染色体复制负调控因子datA在细胞周期中的作用
- 批准号:31060015
- 批准年份:2010
- 资助金额:25.0 万元
- 项目类别:地区科学基金项目
Computational Methods for Analyzing Toponome Data
- 批准号:60601030
- 批准年份:2006
- 资助金额:17.0 万元
- 项目类别:青年科学基金项目
相似海外基金
Using secondary data analyses to establish whether face-shape characteristics predict social judgments of faces consistently across world regions
使用二次数据分析来确定面部形状特征是否能够一致地预测世界各地区对面部的社会判断
- 批准号:
ES/X000249/1 - 财政年份:2023
- 资助金额:
$ 40.8万 - 项目类别:
Research Grant
SHINE: Understanding the Three-Part Structure of Coronal Mass Ejections Combining Data Analyses and Numerical Simulations
SHINE:结合数据分析和数值模拟了解日冕物质抛射的三部分结构
- 批准号:
2301382 - 财政年份:2023
- 资助金额:
$ 40.8万 - 项目类别:
Standard Grant
Magnetic torque data analyses based on Landau theory
基于朗道理论的磁扭矩数据分析
- 批准号:
22H01173 - 财政年份:2022
- 资助金额:
$ 40.8万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
SECONDARY DATA ANALYSES AND INVESTIGATION OF RESEARCH CONCEPT PROPOSALS FROM THE PROSPECTIVE COHORT OF HIV AND ZIKA IN INFANTS AND PREGNANCY STUDY (HIV-ZIP)
二手数据分析和调查婴儿和妊娠研究中艾滋病毒和寨卡病毒前瞻性队列的研究概念提案 (HIV-ZIP)
- 批准号:
10576710 - 财政年份:2021
- 资助金额:
$ 40.8万 - 项目类别:
Toward the implementation of evidence-based health policies to the real world-a trial of using big data analyses by the integration of arts and sciences
将循证卫生政策落实到现实世界——文理结合大数据分析的尝试
- 批准号:
20K20418 - 财政年份:2020
- 资助金额:
$ 40.8万 - 项目类别:
Grant-in-Aid for Challenging Research (Pioneering)
Sex differences in the vascular consequences of diabetes: big data analyses to inform prevention and treatment
糖尿病血管后果的性别差异:大数据分析为预防和治疗提供信息
- 批准号:
MR/P014550/2 - 财政年份:2020
- 资助金额:
$ 40.8万 - 项目类别:
Fellowship
Public Policies, Community Conditions, and Child Abuse and Neglect: National and Statewide Data Analyses and Literature Reviews
公共政策、社区状况以及虐待和忽视儿童:全国和全州数据分析和文献综述
- 批准号:
10268940 - 财政年份:2020
- 资助金额:
$ 40.8万 - 项目类别:
Literature review for environmental effects on song development, plus data analyses
环境对歌曲发展影响的文献综述以及数据分析
- 批准号:
552387-2020 - 财政年份:2020
- 资助金额:
$ 40.8万 - 项目类别:
University Undergraduate Student Research Awards