Machine Learning for Classification and Genome Annotations

用于分类和基因组注释的机器学习

基本信息

  • 批准号:
    RGPIN-2020-04971
  • 负责人:
  • 金额:
    $ 1.75万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Discovery Grants Program - Individual
  • 财政年份:
    2022
  • 资助国家:
    加拿大
  • 起止时间:
    2022-01-01 至 2023-12-31
  • 项目状态:
    已结题

项目摘要

This proposal entitled "Machine Learning for Classification and Genome Annotations" builds on my previous research program funded by NSERC entitled "Computational Intelligence and Applications in Bioinformatics". It has 2 components: 1) Self-adjusting Evolutionary Neural Networks and Applications in Computational Biology Many problems in Computational Biology involve classification, such as classifying cell samples into malignant (cancer) or benign (normal). For such tasks, Neural Networks can be developed and employed. Neural Networks offer a great general framework for machine learning, including classification, image segmentation and understanding. While the neural network field is currently a hot research area, with many successes in image processing and computer vision, relatively little attention has been paid to the learning of activation functions for individual layers or nodes. For this purpose, we propose EvoDNN, an evolutionary deep neural network that employs an evolutionary algorithm to evolve deep heterogeneous feed-forward neural networks. While the majority of current feed-forward neural networks employ user defined homogeneous activation functions, EvoDNN creates heterogeneous multi-layer networks where each neuron's activation function is not statically defined by the user, but dynamically optimized during evolution. One advantage offered by EvoDNN is that the activation functions do not need to be differentiable. This feature gives users a great degree of flexibility over which activation functions to employ. 2) Machine Learning Methods for Semi Automated Genome Annotation (SAGA) A second topic of this proposal is related to machine learning in the area of genome annotation. Semi automated genome annotation (SAGA) methods are widely used to understand genome activity and gene regulation. These methods take as input a set of sequencing based assays of epigenomic activity (such as ChIP-seq measurements of histone modification and transcription factor binding), and output an annotation of the genome that assigns a chromatin state label to each genomic position. Existing SAGA methods have several limitations caused by the discrete annotation framework: such annotations cannot easily represent varying strengths of genomic elements, and they cannot easily represent combinatorial elements that simultaneously exhibit multiple types of activity. To remedy these limitations, we propose an annotation strategy that instead outputs a vector of chromatin state features at each position rather than a single discrete label. Continuous modeling is common in other fields, such as in topic modeling of text documents. We propose a method, epigenome-ssm, that uses a nonnegative Kalman filter state space model to efficiently annotate the genome with chromatin state features. We intend to show that chromatin state features from epigenome-ssm are more useful for several downstream applications than both continuous and discrete alternatives.
这个名为“分类和基因组注释的机器学习”的提案建立在我之前由NSERC资助的名为“计算智能和生物信息学应用”的研究项目的基础上。计算生物学中的许多问题涉及分类,例如将细胞样本分为恶性(癌症)或良性(正常)。对于这样的任务,可以开发和使用神经网络。神经网络为机器学习提供了一个很好的通用框架,包括分类、图像分割和理解。虽然神经网络领域目前是一个热门的研究领域,在图像处理和计算机视觉方面取得了许多成功,但对单个层或节点的激活函数学习的关注相对较少。为此,我们提出了EvoDNN,这是一种进化深度神经网络,它采用进化算法来进化深度异构前馈神经网络。当前大多数前馈神经网络采用用户定义的同构激活函数,而EvoDNN创建了异构多层网络,其中每个神经元的激活函数不是由用户静态定义的,而是在进化过程中动态优化的。EvoDNN提供的一个优点是激活函数不需要是可微的。这个特性为用户提供了很大程度的灵活性,可以选择使用哪些激活函数。2)半自动基因组注释的机器学习方法(SAGA)本提案的第二个主题与基因组注释领域的机器学习有关。半自动基因组注释(Semi - automated genome annotation, SAGA)方法被广泛用于了解基因组活性和基因调控。这些方法将一组基于测序的表观基因组活性测定(如组蛋白修饰和转录因子结合的ChIP-seq测量)作为输入,并输出基因组的注释,该注释将染色质状态标签分配给每个基因组位置。由于离散注释框架,现有的SAGA方法存在一些局限性:这种注释不能很容易地表示基因组元素的不同强度,也不能很容易地表示同时表现出多种活动类型的组合元素。为了弥补这些限制,我们提出了一种注释策略,在每个位置输出染色质状态特征的向量,而不是单个离散标签。连续建模在其他领域也很常见,比如文本文档的主题建模。我们提出了一种方法,即表观基因组-ssm,该方法使用非负卡尔曼滤波状态空间模型有效地用染色质状态特征注释基因组。我们打算表明,与连续和离散替代方案相比,表观基因组-ssm的染色质状态特征对几种下游应用更有用。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Wiese, Kay其他文献

Wiese, Kay的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Wiese, Kay', 18)}}的其他基金

Machine Learning for Classification and Genome Annotations
用于分类和基因组注释的机器学习
  • 批准号:
    RGPIN-2020-04971
  • 财政年份:
    2021
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Discovery Grants Program - Individual
Machine Learning for Classification and Genome Annotations
用于分类和基因组注释的机器学习
  • 批准号:
    RGPIN-2020-04971
  • 财政年份:
    2020
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Discovery Grants Program - Individual
Computational Intelligence and Applications in Bioinformatics
计算智能及其在生物信息学中的应用
  • 批准号:
    238298-2013
  • 财政年份:
    2019
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Discovery Grants Program - Individual
Computational Intelligence and Applications in Bioinformatics
计算智能及其在生物信息学中的应用
  • 批准号:
    238298-2013
  • 财政年份:
    2015
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Discovery Grants Program - Individual
Computational Intelligence and Applications in Bioinformatics
计算智能及其在生物信息学中的应用
  • 批准号:
    238298-2013
  • 财政年份:
    2014
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Discovery Grants Program - Individual
Computational Intelligence and Applications in Bioinformatics
计算智能及其在生物信息学中的应用
  • 批准号:
    238298-2013
  • 财政年份:
    2013
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Discovery Grants Program - Individual
Evolutionary computation and applications in bioinformatics
进化计算及其在生物信息学中的应用
  • 批准号:
    238298-2007
  • 财政年份:
    2010
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Discovery Grants Program - Individual
Evolutionary computation and applications in bioinformatics
进化计算及其在生物信息学中的应用
  • 批准号:
    238298-2007
  • 财政年份:
    2009
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Discovery Grants Program - Individual
Evolutionary computation and applications in bioinformatics
进化计算及其在生物信息学中的应用
  • 批准号:
    238298-2007
  • 财政年份:
    2008
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Discovery Grants Program - Individual
Evolutionary computation and applications in bioinformatics
进化计算及其在生物信息学中的应用
  • 批准号:
    238298-2007
  • 财政年份:
    2007
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Discovery Grants Program - Individual

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Understanding structural evolution of galaxies with machine learning
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
  • 批准号:
    62003314
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
  • 批准号:
    61902016
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
  • 批准号:
    61806040
  • 批准年份:
    2018
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
  • 批准号:
    51769027
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
  • 批准号:
    61573081
  • 批准年份:
    2015
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
基于有向超图的大型个性化e-learning学习过程模型的自动生成与优化
  • 批准号:
    61572533
  • 批准年份:
    2015
  • 资助金额:
    66.0 万元
  • 项目类别:
    面上项目
E-Learning中学习者情感补偿方法的研究
  • 批准号:
    61402392
  • 批准年份:
    2014
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

EAGER: IMPRESS-U: Exploratory Research in Robust Machine Learning for Object Detection and Classification
EAGER:IMPRESS-U:用于对象检测和分类的鲁棒机器学习的探索性研究
  • 批准号:
    2415299
  • 财政年份:
    2024
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Standard Grant
Unsupervised machine learning classification of ADHD subtype by urinary levels of tryptophan and monoamine neurotransmitters
根据尿色氨酸和单胺神经递质水平对 ADHD 亚型进行无监督机器学习分类
  • 批准号:
    23K12814
  • 财政年份:
    2023
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Training of machine learning algorithms for the classification of accelerometer-measured bednet use and related behaviors associated with malaria risk
训练机器学习算法,用于对加速计测量的蚊帐使用和与疟疾风险相关的相关行为进行分类
  • 批准号:
    10727374
  • 财政年份:
    2023
  • 资助金额:
    $ 1.75万
  • 项目类别:
Historical Building Classification Learning System using "Reward" Indicators based on Machine Learning
基于机器学习的使用“奖励”指标的历史建筑分类学习系统
  • 批准号:
    23K16903
  • 财政年份:
    2023
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Making Visualization Scalable (MAVIS) for explaining machine learning classification models
使可视化可扩展(MAVIS)用于解释机器学习分类模型
  • 批准号:
    EP/X029689/1
  • 财政年份:
    2023
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Research Grant
Particle Size Classification for Gravel Aggregate using Machine Learning
使用机器学习对砾石骨料进行粒度分类
  • 批准号:
    571004-2021
  • 财政年份:
    2022
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Applied Research and Development Grants - Level 2
Automated Machine Learning for Electrocardiogram Disease Classification
用于心电图疾病分类的自动机器学习
  • 批准号:
    559616-2021
  • 财政年份:
    2022
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Postgraduate Scholarships - Doctoral
Machine-learning-assisted classification of resonant modes in an optical microcavity lattice
光学微腔晶格中谐振模式的机器学习辅助分类
  • 批准号:
    575009-2022
  • 财政年份:
    2022
  • 资助金额:
    $ 1.75万
  • 项目类别:
    University Undergraduate Student Research Awards
Classification of Ankle Osteoarthritis Severity from Weightbearing Computed Tomography Using Statistical Shape Modeling and Machine Learning
使用统计形状建模和机器学习根据负重计算机断层扫描对踝骨关节炎严重程度进行分类
  • 批准号:
    10525301
  • 财政年份:
    2022
  • 资助金额:
    $ 1.75万
  • 项目类别:
The novel classification system of pediatric brain tumors using machine learning technology
利用机器学习技术的儿童脑肿瘤新分类系统
  • 批准号:
    22K06951
  • 财政年份:
    2022
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了