Reinforcement-Learning Connectionist Systems (Computer and Information Science)

强化学习联结系统(计算机和信息科学)

基本信息

  • 批准号:
    8703566
  • 负责人:
  • 金额:
    $ 15.5万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing grant
  • 财政年份:
    1987
  • 资助国家:
    美国
  • 起止时间:
    1987-06-15 至 1989-11-30
  • 项目状态:
    已结题

项目摘要

Networks of neuron-like processing units, called connectionist systems, have interesting computational properties making them attractive for both psychological modeling and potential application in artificial intelligence. Recent research has led to some promising algorithms for learning in such networks. This project advances such research by developing a mathematically well-founded approach to the design of algorithms for the particular problem of reinforcement learning in connectionist networks of stochastic units. Particular algorithms are developed for learning problems having an important temporal component, such as control problems with feedback delays of unknown duration or problems involving recognition or production of time-varying signals. These algorithms are required to admit a suitable on-line implementation, in which the learning occurs within the operating system. In addition to making advances in the theory of such algorithms, this project involves implementing the more promising candidates and evaluating their performance in simulation experiments. Primary criteria for evaluation are learning efficiency and suspectibility to convergence to suboptimal states. In addition, this project explores the applicability of such algorithms to specific problems in artificial intelligence and robotics through the study of suitably scaled-down versions of these problems. Such problems include speech recognition and adaptive sensorimotor control.
类似神经元的处理单元网络,被称为连接系统,具有有趣的计算特性,这使得它们在心理建模和人工智能的潜在应用方面都很有吸引力。最近的研究已经为这种网络的学习带来了一些很有前途的算法。该项目通过开发一种数学上有充分依据的方法来设计算法,以解决随机单元连接网络中强化学习的特定问题,从而推进了此类研究。针对具有重要时间成分的学习问题,例如具有未知持续时间的反馈延迟的控制问题或涉及识别或产生时变信号的问题,开发了特定算法。这些算法需要允许一个合适的在线实现,其中学习发生在操作系统内。除了在这些算法的理论方面取得进展外,该项目还涉及实现更有前途的候选算法并在模拟实验中评估其性能。评估的主要标准是学习效率和收敛到次优状态的怀疑性。此外,本项目通过研究这些问题的适当缩小版本,探索这些算法对人工智能和机器人技术中特定问题的适用性。这些问题包括语音识别和自适应感觉运动控制。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Ronald Williams其他文献

Comparative characterization of organic emissions from diesel particles, coke oven mains, roofing tar vapors and cigarette smoke condensate.
柴油颗粒、焦炉总管、屋顶焦油蒸气和香烟烟雾冷凝物有机排放的比较特征。
Reliability of a standardized brief-pulse stimulus in ECT
ECT 中标准化短脉冲刺激的可靠性
  • DOI:
    10.1016/0006-3223(85)90138-6
  • 发表时间:
    1985
  • 期刊:
  • 影响因子:
    10.6
  • 作者:
    L. Weaver;J. Ives;Ronald Williams
  • 通讯作者:
    Ronald Williams
Protein Energy Malnutrition
蛋白质能量营养不良
  • DOI:
    10.1007/springerreference_42288
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ronald Williams;Tatwig Guirguis
  • 通讯作者:
    Tatwig Guirguis
SAFETY OR EFFICACY; CAN OR SHOULD WE HAVE BOTH? TABOO DEVICES IN THE MRI ENVIRONMENT
  • DOI:
    10.1016/s0735-1097(21)01702-2
  • 发表时间:
    2021-05-11
  • 期刊:
  • 影响因子:
  • 作者:
    Robert W.W. Biederman;Loretta Gevenosky;Huma Samar;Ronald Williams;Richard Lombardi;Moneal Shah;Victor Farah;Francesco Mangini;Christopher Bonnet;Mark Doyle
  • 通讯作者:
    Mark Doyle
A Stab in the Heart: Scimitar Pulmonary Venous Anomaly Complicating a Case of Cardiogenic Shock
  • DOI:
    10.1016/j.cardfail.2019.07.155
  • 发表时间:
    2019-08-01
  • 期刊:
  • 影响因子:
  • 作者:
    Kinan Kassar;Ronald Williams;Veer Manik;Craig Alpert;Omer Bajwa;Hadi Azam
  • 通讯作者:
    Hadi Azam

Ronald Williams的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Ronald Williams', 18)}}的其他基金

GOAL: Guided On-Demand Adaptive Learning
目标:引导式按需自适应学习
  • 批准号:
    0837643
  • 财政年份:
    2009
  • 资助金额:
    $ 15.5万
  • 项目类别:
    Standard Grant
ITR: Security Education in Embedded Computing
ITR:嵌入式计算的安全教育
  • 批准号:
    0082635
  • 财政年份:
    2000
  • 资助金额:
    $ 15.5万
  • 项目类别:
    Continuing Grant
1996 Presidential Awardees
1996 总统奖获得者
  • 批准号:
    9708880
  • 财政年份:
    1997
  • 资助金额:
    $ 15.5万
  • 项目类别:
    Standard Grant
Advanced Undergraduate Laboratory in Plasma Physics
等离子体物理高级本科实验室
  • 批准号:
    9451948
  • 财政年份:
    1994
  • 资助金额:
    $ 15.5万
  • 项目类别:
    Standard Grant
Connectionist Learning Algorithms for Temporal Processing and Multi-Scale Search
用于时间处理和多尺度搜索的联结学习算法
  • 批准号:
    8921275
  • 财政年份:
    1990
  • 资助金额:
    $ 15.5万
  • 项目类别:
    Continuing grant
VLSI Circuit Design Workstations
VLSI 电路设计工作站
  • 批准号:
    8851570
  • 财政年份:
    1988
  • 资助金额:
    $ 15.5万
  • 项目类别:
    Standard Grant
Development of a Fourier Transform Spectrometer for the Study of Low-Frequency Raman Spectroscopy of Proteins (Chemistry)
开发用于蛋白质低频拉曼光谱研究的傅里叶变换光谱仪(化学)
  • 批准号:
    8509618
  • 财政年份:
    1985
  • 资助金额:
    $ 15.5万
  • 项目类别:
    Standard Grant
Equipment For Undergraduate Computer Engineering and Computer Science
本科计算机工程和计算机科学设备
  • 批准号:
    7814135
  • 财政年份:
    1978
  • 资助金额:
    $ 15.5万
  • 项目类别:
    Standard Grant

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Understanding structural evolution of galaxies with machine learning
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
  • 批准号:
    62003314
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
  • 批准号:
    61902016
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
  • 批准号:
    61806040
  • 批准年份:
    2018
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
  • 批准号:
    51769027
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
  • 批准号:
    61573081
  • 批准年份:
    2015
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
基于有向超图的大型个性化e-learning学习过程模型的自动生成与优化
  • 批准号:
    61572533
  • 批准年份:
    2015
  • 资助金额:
    66.0 万元
  • 项目类别:
    面上项目
E-Learning中学习者情感补偿方法的研究
  • 批准号:
    61402392
  • 批准年份:
    2014
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Interdisciplinary studies of non-monotonic reasoning, connectionist and monotonic symoblic learning
非单调推理、联结主义和单调符号学习的跨学科研究
  • 批准号:
    889-1994
  • 财政年份:
    1997
  • 资助金额:
    $ 15.5万
  • 项目类别:
    Discovery Grants Program - Individual
Interdisciplinary studies of non-monotonic reasoning, connectionist and monotonic symoblic learning
非单调推理、联结主义和单调符号学习的跨学科研究
  • 批准号:
    889-1994
  • 财政年份:
    1996
  • 资助金额:
    $ 15.5万
  • 项目类别:
    Discovery Grants Program - Individual
Generative connectionist models of cognition and learning
认知和学习的生成联结模型
  • 批准号:
    7927-1994
  • 财政年份:
    1996
  • 资助金额:
    $ 15.5万
  • 项目类别:
    Discovery Grants Program - Individual
Generative connectionist models of cognition and learning
认知和学习的生成联结模型
  • 批准号:
    7927-1994
  • 财政年份:
    1995
  • 资助金额:
    $ 15.5万
  • 项目类别:
    Discovery Grants Program - Individual
Interdisciplinary studies of non-monotonic reasoning, connectionist and monotonic symoblic learning
非单调推理、联结主义和单调符号学习的跨学科研究
  • 批准号:
    889-1994
  • 财政年份:
    1995
  • 资助金额:
    $ 15.5万
  • 项目类别:
    Discovery Grants Program - Individual
EXPLORATIONS OF A CONNECTIONIST CATEGORY LEARNING MODEL
连接主义范畴学习模型的探索
  • 批准号:
    2250843
  • 财政年份:
    1994
  • 资助金额:
    $ 15.5万
  • 项目类别:
EXPLORATIONS OF A CONNECTIONIST CATEGORY LEARNING MODEL
连接主义范畴学习模型的探索
  • 批准号:
    2675161
  • 财政年份:
    1994
  • 资助金额:
    $ 15.5万
  • 项目类别:
EXPLORATIONS OF A CONNECTIONIST CATEGORY LEARNING MODEL
连接主义范畴学习模型的探索
  • 批准号:
    2250842
  • 财政年份:
    1994
  • 资助金额:
    $ 15.5万
  • 项目类别:
EXPLORATIONS OF A CONNECTIONIST CATEGORY LEARNING MODEL
连接主义范畴学习模型的探索
  • 批准号:
    2392950
  • 财政年份:
    1994
  • 资助金额:
    $ 15.5万
  • 项目类别:
Generative connectionist models of cognition and learning
认知和学习的生成联结模型
  • 批准号:
    7927-1994
  • 财政年份:
    1994
  • 资助金额:
    $ 15.5万
  • 项目类别:
    Discovery Grants Program - Individual
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了