Transfer learning for continual learning in non-stationary environments

用于非静态环境中持续学习的迁移学习

基本信息

  • 批准号:
    553522-2020
  • 负责人:
  • 金额:
    $ 11.98万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Alliance Grants
  • 财政年份:
    2020
  • 资助国家:
    加拿大
  • 起止时间:
    2020-01-01 至 2021-12-31
  • 项目状态:
    已结题

项目摘要

Currently available artificial intelligence algorithms require re-training whenever their application environment undergoes fundamental changes and a new task is given. The ability to build an automated algorithm that can learn reliably under changing situations will therefore set new standards in the field. The main goal of this project is to develop new frameworks in which reinforcement learning algorithms can perform more stably and achieve higher sample and computational efficiency among a set of similar tasks in stochastic environment. That is, we intend to use transfer learning to address continual learning in non-stationary environments. To do so, we propose the following three objectives: 1) We will build adaptive neural network-based reinforcement learning models that will construct a knowledge representation that fits the non-stationary environmental complexity. This can be understood as a particular type of continual learning. 2) We will evaluate the performance of the developed frameworks/models in real-world applications which will be identified in collaboration with LG Electronics Canada. The identified problems may involve vision inspection data as inputs. 3) We will investigate how these frameworks/models perform when transferred to new environments in terms of dynamics, rewards and goals. The transfer learning frameworks/models will be combined with the developed continual learning frameworks/models. To sum up, the proposed project is to advance the current state-of-the-art of reinforcement learning so as to improve the sample and computational efficiency across similarly configured tasks and to robustify its performance in non-stationary environment.
目前可用的人工智能算法需要重新训练时,他们的应用环境发生了根本性的变化,并给出了一个新的任务。因此,构建一种能够在不断变化的情况下可靠学习的自动化算法的能力将在该领域树立新的标准。该项目的主要目标是开发新的框架,使强化学习算法能够在随机环境中的一组相似任务中更稳定地执行,并实现更高的样本和计算效率。也就是说,我们打算使用迁移学习来解决非静态环境中的持续学习。为此,我们提出以下三个目标: 1)我们将构建基于自适应神经网络的强化学习模型,该模型将构建适合非平稳环境复杂性的知识表示。这可以理解为一种特殊的持续学习。 2)我们将评估开发的框架/模型在实际应用中的性能,这些应用将与LG Electronics Canada合作确定。所识别的问题可能涉及视觉检查数据作为输入。 3)我们将研究这些框架/模型在动态、奖励和目标方面转移到新环境时的表现。迁移学习框架/模型将与已开发的持续学习框架/模型相结合。 总而言之,该项目旨在推进强化学习的当前发展水平,以提高类似配置任务的样本和计算效率,并增强其在非平稳环境中的性能。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Lee, ChiGuhn其他文献

Lee, ChiGuhn的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Lee, ChiGuhn', 18)}}的其他基金

Reinforcement learning approach to the optimal stopping problem
最优停止问题的强化学习方法
  • 批准号:
    RGPIN-2021-02760
  • 财政年份:
    2022
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Discovery Grants Program - Individual
Reinforcement learning approach to the optimal stopping problem
最优停止问题的强化学习方法
  • 批准号:
    RGPIN-2021-02760
  • 财政年份:
    2021
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Discovery Grants Program - Individual
Transfer learning for continual learning in non-stationary environments
用于非静态环境中持续学习的迁移学习
  • 批准号:
    553522-2020
  • 财政年份:
    2021
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Alliance Grants
Machine Learning-enhanced approaches to optimization of supply chain management at Nestlé Canada
雀巢加拿大采用机器学习增强方法优化供应链管理
  • 批准号:
    538626-2019
  • 财政年份:
    2020
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Collaborative Research and Development Grants
Machine Learning-enhanced approaches to optimization of supply chain management at Nestlé Canada
雀巢加拿大采用机器学习增强方法优化供应链管理
  • 批准号:
    538626-2019
  • 财政年份:
    2019
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Collaborative Research and Development Grants
Assistive sequential decision making framework
辅助顺序决策框架
  • 批准号:
    RGPIN-2019-05460
  • 财政年份:
    2019
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Discovery Grants Program - Individual
Data-driven condition-based maintenance models
数据驱动的基于状态的维护模型
  • 批准号:
    499283-2016
  • 财政年份:
    2018
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Collaborative Research and Development Grants
Optimal Economic Change Detection with Imperfect Information
不完全信息下的最优经济变化检测
  • 批准号:
    RGPIN-2014-04145
  • 财政年份:
    2018
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Discovery Grants Program - Individual
Optimal Economic Change Detection with Imperfect Information
不完全信息下的最优经济变化检测
  • 批准号:
    RGPIN-2014-04145
  • 财政年份:
    2017
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Discovery Grants Program - Individual
Dynamic Optimization with Learning Approach to Dynamic Pricing with Financial Milestones
具有财务里程碑的动态定价学习方法的动态优化
  • 批准号:
    507238-2016
  • 财政年份:
    2016
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Engage Grants Program

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Understanding structural evolution of galaxies with machine learning
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
  • 批准号:
    62003314
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
  • 批准号:
    61902016
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
儿童音乐能力发展对语言与社会认知能力及脑发育的影响
  • 批准号:
    31971003
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
  • 批准号:
    61806040
  • 批准年份:
    2018
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
  • 批准号:
    51769027
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
多场景网络学习中基于行为-情感-主题联合建模的学习者兴趣挖掘关键技术研究
  • 批准号:
    61702207
  • 批准年份:
    2017
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于异构医学影像数据的深度挖掘技术及中枢神经系统重大疾病的精准预测
  • 批准号:
    61672236
  • 批准年份:
    2016
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目

相似海外基金

CRII: CSR: Enabling On-Device Continual Learning through Enhancing Efficiency of Computing, Memory, and Data
CRII:CSR:通过提高计算、内存和数据的效率实现设备上的持续学习
  • 批准号:
    2348376
  • 财政年份:
    2024
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Standard Grant
CAREER: Continual Learning with Evolving Memory, Soft Supervision, and Cross-Domain Knowledge - Foundational Theory and Advanced Algorithms
职业:利用进化记忆、软监督和跨领域知识进行持续学习——基础理论和高级算法
  • 批准号:
    2338506
  • 财政年份:
    2024
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Continuing Grant
CAREER: Towards Continual Learning on Evolving Graphs: from Memorization to Generalization
职业:走向演化图的持续学习:从记忆到泛化
  • 批准号:
    2338878
  • 财政年份:
    2024
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Continuing Grant
FuSe: Co-designing Continual-Learning Edge Architectures with Hetero-Integrated Silicon-CMOS and Electrochemical Random-Access Memory
FuSe:利用异质集成硅 CMOS 和电化学随机存取存储器共同设计持续学习边缘架构
  • 批准号:
    2329096
  • 财政年份:
    2023
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Continuing Grant
Collaborative Research: CSR: Small: Expediting Continual Online Learning on Edge Platforms through Software-Hardware Co-designs
协作研究:企业社会责任:小型:通过软硬件协同设计加快边缘平台上的持续在线学习
  • 批准号:
    2312157
  • 财政年份:
    2023
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Standard Grant
Towards Real-world Continual Learning on Unrestricted Task Steams
在不受限制的任务流上实现现实世界的持续学习
  • 批准号:
    DE230101591
  • 财政年份:
    2023
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Discovery Early Career Researcher Award
Development of an sEMG-based Human-Computer Interface Utilizing Deep Transfer Learning and Continual Learning
利用深度迁移学习和持续学习开发基于表面肌电图的人机界面
  • 批准号:
    23H03445
  • 财政年份:
    2023
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
MultiTasking and Continual Learning for Audio Sensing Tasks on Resource-Constrained Platforms
资源受限平台上音频传感任务的多任务处理和持续学习
  • 批准号:
    EP/X01200X/1
  • 财政年份:
    2023
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Research Grant
A study on environmental sound analysis based on unified and continual learning
基于统一持续学习的环境声分析研究
  • 批准号:
    23K16908
  • 财政年份:
    2023
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
CAREER: Efficient, Dynamic, Robust, and On-Device Continual Deep Learning with Non-Volatile Memory based In-Memory Computing System
职业:使用基于非易失性内存的内存计算系统进行高效、动态、鲁棒、设备上持续深度学习
  • 批准号:
    2342726
  • 财政年份:
    2023
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了