Machine learning for high-dimensional data in genetics and neuroscience

遗传学和神经科学中高维数据的机器学习

基本信息

  • 批准号:
    RGPIN-2019-05484
  • 负责人:
  • 金额:
    $ 1.17万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Discovery Grants Program - Individual
  • 财政年份:
    2021
  • 资助国家:
    加拿大
  • 起止时间:
    2021-01-01 至 2022-12-31
  • 项目状态:
    已结题

项目摘要

My recent work was a collaborative creation of a catalogue of the genetic basis of human brain structure and function (L. Elliott et al. Nature. 2018). I also co-created new software (Bycroft et al. Nature. 2018) to conduct efficient genome wide association studies (GWAS) on a new generation of large-scale consortia such as UK Biobank, the China Kadoorie Biobank and AllofUs (each with more than 0.5 million subjects). Current methods uncover associations in such data, but modern machine learning (ML) s required to find patterns in the large number of associations found, and also to extend associations to phenotype predictions. This proposal involves four aims designed to advance ML methods for genetics and bioinformatics in application to large-scale GWAS. My first aim is to develop ML techniques that operate on association results from GWAS. Patterns in the associations of GWAS are exploited by current methods to estimate heritability of phenotypes. My work towards this aim will use techniques from ML disciplines of multi-task learning to further analyse these associations, uncovering latent genetic processes involving groups of variants and groups of phenotypes. My second aim is to use ML techniques such as deep learning and Bayesian nonparametrics to predict phenotypes. There is much recent interest in deep learning with convolutional neural networks, but there is no definitive application of deep learning to GWAS. This is due to the lack of context sensitive information in the formulation of GWAS. I will investigate methods for adding context sensitive information to the input layers of deep neural network. This work could have groundbreaking impact in deep learning. My third aim is to conduct a GWAS on brain images at the level of the volumetric pixel (voxel). Recent work in voxelwise GWAS has not produced statistically significant results. By using data from large-scale consortia, and efficient methods for controlling for spatial noise in brain image signals, I will create fine-scale maps of genetic variation in human brain structure. This work will allow greater understanding of brain variation. My fourth aim is to advance methods related to kinship matrices. The kinship matrix is a fundamental unit encoding genetic similarity between pairs of subjects of a study. It is used to control for socioeconomic and geographical variation within study participants, but the computational cost of computing the kinship matrix precludes its' widespread adoption. I will develop new and efficient methods for computing and approximating the kinship matrix on large-scale consortia, allowing more accurate GWAS results. This research program will support the training of highly qualified personnel, and the software developed in this research program will be released under open source licenses. I anticipate that this research program will form a foundation for ML on the new generation of large-scale consortia, with impact in broad areas of neuroscience.
我最近的工作是合作创建一个人脑结构和功能的遗传基础目录(L.Elliott等人)。大自然。2018年)。我还参与开发了新软件(Bycroft等人,大自然。2018年)对新一代大型联合体,如英国生物库、中国嘉道理生物库和阿洛夫斯(每个拥有超过50万个主题)进行高效的全基因组关联研究(GWAS)。目前的方法在这些数据中发现关联,但现代机器学习(ML)S需要在发现的大量关联中发现模式,并将关联扩展到表型预测。这项建议涉及四个目标,旨在推动遗传学和生物信息学的ML方法在大规模GWAs中的应用。我的第一个目标是开发对GWAS的关联结果进行操作的ML技术。目前的方法利用遗传相关中的模式来估计表型的遗传力。为了这个目标,我的工作将使用多任务学习的ML学科的技术来进一步分析这些关联,揭示涉及一组变异和一组表型的潜在遗传过程。我的第二个目标是使用ML技术,如深度学习和贝叶斯非参数学来预测表型。最近人们对卷积神经网络的深度学习很感兴趣,但还没有明确的深度学习在GWA中的应用。这是因为在制定全球气候变化框架时缺乏对环境敏感的信息。我将研究将上下文敏感信息添加到深度神经网络的输入层的方法。这项工作可能会对深度学习产生开创性的影响。我的第三个目标是在体积像素(体素)的水平上对大脑图像进行GWA。最近在体素GWAS方面的工作没有产生统计上的显著结果。通过使用来自大型财团的数据,以及控制大脑图像信号中空间噪声的有效方法,我将创建人类大脑结构遗传变异的精细地图。这项工作将使人们能够更好地理解大脑的变异。我的第四个目标是改进与亲属关系矩阵相关的方法。亲属关系矩阵是编码研究对象对之间遗传相似性的基本单位。它被用来控制研究参与者的社会经济和地理差异,但计算亲属关系矩阵的计算成本阻碍了它的广泛采用。我将开发新的、高效的方法来计算和近似大规模联盟的亲属关系矩阵,从而获得更准确的GWAS结果。该研究计划将支持高素质人才的培训,该研究计划中开发的软件将在开放源码许可下发布。我预计这项研究计划将为ML关于新一代大型财团的研究奠定基础,并在神经科学的广泛领域产生影响。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Elliott, Lloyd其他文献

Elliott, Lloyd的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Elliott, Lloyd', 18)}}的其他基金

Machine learning for high-dimensional data in genetics and neuroscience
遗传学和神经科学中高维数据的机器学习
  • 批准号:
    RGPIN-2019-05484
  • 财政年份:
    2022
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Discovery Grants Program - Individual
Machine learning for high-dimensional data in genetics and neuroscience
遗传学和神经科学中高维数据的机器学习
  • 批准号:
    RGPIN-2019-05484
  • 财政年份:
    2020
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Discovery Grants Program - Individual
Machine learning for high-dimensional data in genetics and neuroscience
遗传学和神经科学中高维数据的机器学习
  • 批准号:
    RGPIN-2019-05484
  • 财政年份:
    2019
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Discovery Grants Program - Individual
Machine learning for high-dimensional data in genetics and neuroscience
遗传学和神经科学中高维数据的机器学习
  • 批准号:
    DGECR-2019-00118
  • 财政年份:
    2019
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Discovery Launch Supplement
Hierarchical sensorimotor control
分层感觉运动控制
  • 批准号:
    374370-2009
  • 财政年份:
    2009
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Postgraduate Scholarships - Master's
Primes and irreducible polynomials
素数和不可约多项式
  • 批准号:
    353657-2007
  • 财政年份:
    2007
  • 资助金额:
    $ 1.17万
  • 项目类别:
    University Undergraduate Student Research Awards

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Understanding structural evolution of galaxies with machine learning
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
  • 批准号:
    62003314
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
  • 批准号:
    61902016
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
儿童音乐能力发展对语言与社会认知能力及脑发育的影响
  • 批准号:
    31971003
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
  • 批准号:
    61806040
  • 批准年份:
    2018
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
  • 批准号:
    51769027
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
多场景网络学习中基于行为-情感-主题联合建模的学习者兴趣挖掘关键技术研究
  • 批准号:
    61702207
  • 批准年份:
    2017
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于异构医学影像数据的深度挖掘技术及中枢神经系统重大疾病的精准预测
  • 批准号:
    61672236
  • 批准年份:
    2016
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目

相似海外基金

Theoretical Guarantees of Machine Learning Methods for High Dimensional Partial Differential Equations: Numerical Analysis and Uncertainty Quantification
高维偏微分方程机器学习方法的理论保证:数值分析和不确定性量化
  • 批准号:
    2343135
  • 财政年份:
    2023
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Standard Grant
Cloud-Based Machine Learning and Biomarker Visual Analytics for Salivary Proteomics
基于云的机器学习和唾液蛋白质组生物标志物可视化分析
  • 批准号:
    10827649
  • 财政年份:
    2023
  • 资助金额:
    $ 1.17万
  • 项目类别:
Machine Learning with Scintillation Photon Counting Detectors to Advance PET Imaging Performance
利用闪烁光子计数探测器进行机器学习以提高 PET 成像性能
  • 批准号:
    10742435
  • 财政年份:
    2023
  • 资助金额:
    $ 1.17万
  • 项目类别:
Machine Learning-Based Identification of Cardiomyopathy Risk in Childhood Cancer Survivors
基于机器学习的儿童癌症幸存者心肌病风险识别
  • 批准号:
    10730177
  • 财政年份:
    2023
  • 资助金额:
    $ 1.17万
  • 项目类别:
High-throughput Phenotyping of iPSC-derived Airway Epithelium by Multiscale Machine Learning Microscopy
通过多尺度机器学习显微镜对 iPSC 衍生的气道上皮进行高通量表型分析
  • 批准号:
    10659397
  • 财政年份:
    2023
  • 资助金额:
    $ 1.17万
  • 项目类别:
Collaborative Research: DMS/NIGMS 2: Novel machine-learning framework for AFMscanner in DNA-protein interaction detection
合作研究:DMS/NIGMS 2:用于 DNA-蛋白质相互作用检测的 AFM 扫描仪的新型机器学习框架
  • 批准号:
    10797460
  • 财政年份:
    2023
  • 资助金额:
    $ 1.17万
  • 项目类别:
Machine Learning and Radiomics Techniques for Analysis of Daily MRI in Glioblastoma Patients
用于分析胶质母细胞瘤患者日常 MRI 的机器学习和放射组学技术
  • 批准号:
    10751672
  • 财政年份:
    2023
  • 资助金额:
    $ 1.17万
  • 项目类别:
Applications of Infinite Dimensional Compressive Sensing to Multi-Dimensional Analog Images using Machine Learning to Enhance Results
利用机器学习将无限维压缩感知应用于多维模拟图像以增强结果
  • 批准号:
    2889834
  • 财政年份:
    2023
  • 资助金额:
    $ 1.17万
  • 项目类别:
    Studentship
Machine learning methods for the analysis and modeling of spatial proteomics data
用于空间蛋白质组数据分析和建模的机器学习方法
  • 批准号:
    10576681
  • 财政年份:
    2023
  • 资助金额:
    $ 1.17万
  • 项目类别:
Machine Learning Approaches for Behavioral Phenotyping of Humanized Knock-in Models of Alzheimer's Disease
用于阿尔茨海默病人源化敲入模型行为表型的机器学习方法
  • 批准号:
    10741685
  • 财政年份:
    2023
  • 资助金额:
    $ 1.17万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了