Machine learning for high-dimensional data in genetics and neuroscience
遗传学和神经科学中高维数据的机器学习
基本信息
- 批准号:RGPIN-2019-05484
- 负责人:
- 金额:$ 1.17万
- 依托单位:
- 依托单位国家:加拿大
- 项目类别:Discovery Grants Program - Individual
- 财政年份:2022
- 资助国家:加拿大
- 起止时间:2022-01-01 至 2023-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
My recent work was a collaborative creation of a catalogue of the genetic basis of human brain structure and function (L. Elliott et al. Nature. 2018). I also co-created new software (Bycroft et al. Nature. 2018) to conduct efficient genome wide association studies (GWAS) on a new generation of large-scale consortia such as UK Biobank, the China Kadoorie Biobank and AllofUs (each with more than 0.5 million subjects). Current methods uncover associations in such data, but modern machine learning (ML) s required to find patterns in the large number of associations found, and also to extend associations to phenotype predictions. This proposal involves four aims designed to advance ML methods for genetics and bioinformatics in application to large-scale GWAS. My first aim is to develop ML techniques that operate on association results from GWAS. Patterns in the associations of GWAS are exploited by current methods to estimate heritability of phenotypes. My work towards this aim will use techniques from ML disciplines of multi-task learning to further analyse these associations, uncovering latent genetic processes involving groups of variants and groups of phenotypes. My second aim is to use ML techniques such as deep learning and Bayesian nonparametrics to predict phenotypes. There is much recent interest in deep learning with convolutional neural networks, but there is no definitive application of deep learning to GWAS. This is due to the lack of context sensitive information in the formulation of GWAS. I will investigate methods for adding context sensitive information to the input layers of deep neural network. This work could have groundbreaking impact in deep learning. My third aim is to conduct a GWAS on brain images at the level of the volumetric pixel (voxel). Recent work in voxelwise GWAS has not produced statistically significant results. By using data from large-scale consortia, and efficient methods for controlling for spatial noise in brain image signals, I will create fine-scale maps of genetic variation in human brain structure. This work will allow greater understanding of brain variation. My fourth aim is to advance methods related to kinship matrices. The kinship matrix is a fundamental unit encoding genetic similarity between pairs of subjects of a study. It is used to control for socioeconomic and geographical variation within study participants, but the computational cost of computing the kinship matrix precludes its' widespread adoption. I will develop new and efficient methods for computing and approximating the kinship matrix on large-scale consortia, allowing more accurate GWAS results. This research program will support the training of highly qualified personnel, and the software developed in this research program will be released under open source licenses. I anticipate that this research program will form a foundation for ML on the new generation of large-scale consortia, with impact in broad areas of neuroscience.
我最近的工作是合作创建一个人类大脑结构和功能的遗传基础目录(L。Elliott等人,Nature. 2018年)。我还共同创建了新的软件(Bycroft et al. Nature. 2018年)对新一代大型联盟进行有效的全基因组关联研究(GWAS),如英国生物银行,中国嘉道理生物银行和AllofUs(每个都有超过50万名受试者)。目前的方法揭示了这些数据中的关联,但现代机器学习(ML)需要在发现的大量关联中找到模式,并将关联扩展到表型预测。该提案涉及四个目标,旨在将遗传学和生物信息学的ML方法应用于大规模GWAS。我的第一个目标是开发对GWAS的关联结果进行操作的ML技术。目前的方法利用GWAS关联中的模式来估计表型的遗传力。我的工作将使用多任务学习的ML学科技术来进一步分析这些关联,揭示涉及变体组和表型组的潜在遗传过程。 我的第二个目标是使用机器学习技术,如深度学习和贝叶斯非参数化来预测表型。最近人们对卷积神经网络的深度学习很感兴趣,但深度学习在GWAS中还没有明确的应用。这是由于在制定GWAS时缺乏对上下文敏感的信息。我将研究向深度神经网络的输入层添加上下文敏感信息的方法。这项工作可能会对深度学习产生开创性的影响。我的第三个目标是在体积像素(体素)水平上对大脑图像进行GWAS。最近的工作在voxelwise GWAS没有产生统计上显着的结果。通过使用来自大规模财团的数据,以及控制大脑图像信号中空间噪声的有效方法,我将创建人类大脑结构遗传变异的精细地图。这项工作将使人们更好地了解大脑的变化。我的第四个目标是推进与亲属矩阵相关的方法。亲属矩阵是编码研究对象之间遗传相似性的基本单位。它被用来控制研究参与者的社会经济和地理差异,但计算亲属矩阵的计算成本阻碍了它的广泛采用。我将开发新的和有效的方法来计算和近似的亲属矩阵的大规模财团,允许更准确的GWAS结果。该研究计划将支持高素质人才的培训,该研究计划中开发的软件将在开源许可证下发布。我预计这项研究计划将为新一代大型联盟的ML奠定基础,并在神经科学的广泛领域产生影响。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Elliott, Lloyd其他文献
Elliott, Lloyd的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Elliott, Lloyd', 18)}}的其他基金
Machine learning for high-dimensional data in genetics and neuroscience
遗传学和神经科学中高维数据的机器学习
- 批准号:
RGPIN-2019-05484 - 财政年份:2021
- 资助金额:
$ 1.17万 - 项目类别:
Discovery Grants Program - Individual
Machine learning for high-dimensional data in genetics and neuroscience
遗传学和神经科学中高维数据的机器学习
- 批准号:
RGPIN-2019-05484 - 财政年份:2020
- 资助金额:
$ 1.17万 - 项目类别:
Discovery Grants Program - Individual
Machine learning for high-dimensional data in genetics and neuroscience
遗传学和神经科学中高维数据的机器学习
- 批准号:
RGPIN-2019-05484 - 财政年份:2019
- 资助金额:
$ 1.17万 - 项目类别:
Discovery Grants Program - Individual
Machine learning for high-dimensional data in genetics and neuroscience
遗传学和神经科学中高维数据的机器学习
- 批准号:
DGECR-2019-00118 - 财政年份:2019
- 资助金额:
$ 1.17万 - 项目类别:
Discovery Launch Supplement
Hierarchical sensorimotor control
分层感觉运动控制
- 批准号:
374370-2009 - 财政年份:2009
- 资助金额:
$ 1.17万 - 项目类别:
Postgraduate Scholarships - Master's
Primes and irreducible polynomials
素数和不可约多项式
- 批准号:
353657-2007 - 财政年份:2007
- 资助金额:
$ 1.17万 - 项目类别:
University Undergraduate Student Research Awards
相似国自然基金
Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:合作创新研究团队
Understanding structural evolution of galaxies with machine learning
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
- 批准号:62003314
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
- 批准号:61902016
- 批准年份:2019
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
儿童音乐能力发展对语言与社会认知能力及脑发育的影响
- 批准号:31971003
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
- 批准号:61806040
- 批准年份:2018
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
- 批准号:51769027
- 批准年份:2017
- 资助金额:38.0 万元
- 项目类别:地区科学基金项目
多场景网络学习中基于行为-情感-主题联合建模的学习者兴趣挖掘关键技术研究
- 批准号:61702207
- 批准年份:2017
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
基于异构医学影像数据的深度挖掘技术及中枢神经系统重大疾病的精准预测
- 批准号:61672236
- 批准年份:2016
- 资助金额:64.0 万元
- 项目类别:面上项目
相似海外基金
Theoretical Guarantees of Machine Learning Methods for High Dimensional Partial Differential Equations: Numerical Analysis and Uncertainty Quantification
高维偏微分方程机器学习方法的理论保证:数值分析和不确定性量化
- 批准号:
2343135 - 财政年份:2023
- 资助金额:
$ 1.17万 - 项目类别:
Standard Grant
Cloud-Based Machine Learning and Biomarker Visual Analytics for Salivary Proteomics
基于云的机器学习和唾液蛋白质组生物标志物可视化分析
- 批准号:
10827649 - 财政年份:2023
- 资助金额:
$ 1.17万 - 项目类别:
Machine Learning with Scintillation Photon Counting Detectors to Advance PET Imaging Performance
利用闪烁光子计数探测器进行机器学习以提高 PET 成像性能
- 批准号:
10742435 - 财政年份:2023
- 资助金额:
$ 1.17万 - 项目类别:
Machine Learning-Based Identification of Cardiomyopathy Risk in Childhood Cancer Survivors
基于机器学习的儿童癌症幸存者心肌病风险识别
- 批准号:
10730177 - 财政年份:2023
- 资助金额:
$ 1.17万 - 项目类别:
Collaborative Research: DMS/NIGMS 2: Novel machine-learning framework for AFMscanner in DNA-protein interaction detection
合作研究:DMS/NIGMS 2:用于 DNA-蛋白质相互作用检测的 AFM 扫描仪的新型机器学习框架
- 批准号:
10797460 - 财政年份:2023
- 资助金额:
$ 1.17万 - 项目类别:
High-throughput Phenotyping of iPSC-derived Airway Epithelium by Multiscale Machine Learning Microscopy
通过多尺度机器学习显微镜对 iPSC 衍生的气道上皮进行高通量表型分析
- 批准号:
10659397 - 财政年份:2023
- 资助金额:
$ 1.17万 - 项目类别:
Machine Learning and Radiomics Techniques for Analysis of Daily MRI in Glioblastoma Patients
用于分析胶质母细胞瘤患者日常 MRI 的机器学习和放射组学技术
- 批准号:
10751672 - 财政年份:2023
- 资助金额:
$ 1.17万 - 项目类别:
Applications of Infinite Dimensional Compressive Sensing to Multi-Dimensional Analog Images using Machine Learning to Enhance Results
利用机器学习将无限维压缩感知应用于多维模拟图像以增强结果
- 批准号:
2889834 - 财政年份:2023
- 资助金额:
$ 1.17万 - 项目类别:
Studentship
Machine learning methods for the analysis and modeling of spatial proteomics data
用于空间蛋白质组数据分析和建模的机器学习方法
- 批准号:
10576681 - 财政年份:2023
- 资助金额:
$ 1.17万 - 项目类别:
Machine Learning Approaches for Behavioral Phenotyping of Humanized Knock-in Models of Alzheimer's Disease
用于阿尔茨海默病人源化敲入模型行为表型的机器学习方法
- 批准号:
10741685 - 财政年份:2023
- 资助金额:
$ 1.17万 - 项目类别: