RTML: Small: Real-Time Model-Based Bayesian Reinforcement Learning

RTML:小型:基于实时模型的贝叶斯强化学习

基本信息

  • 批准号:
    1937396
  • 负责人:
  • 金额:
    $ 50万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-10-01 至 2023-09-30
  • 项目状态:
    已结题

项目摘要

The applicability of many machine-learning techniques is limited to very specific, fixed application environments. As opposed to this, model-based Bayesian reinforcement learning technique is a more sophisticated framework, enabling human-like decision-making with evolving objectives and without complete knowledge of the environment. However, its computational complexity is very high, and consequently, its progress has been limited to small-scale demonstrations on limited applications. The goal of this project is to overcome this hurdle by developing innovative algorithm-hardware co-design techniques. The research outcome is expected to greatly accelerate the computation of model-based Bayesian reinforcement learning for practical, large-scale real-life applications, especially those with real-time constraints. The research results will benefit many fields that directly impact society, e.g., driver-less cars, unmanned aerial vehicles, smart agricultural irrigation, robotics for disaster relief and robotic assistants for handicapped people. The research will also train students, including women and other underrepresented groups, for the much needed U.S. workforce in related areas of technology.The computational kernel of model-based Bayesian reinforcement learning is random sampling over a decision tree. In this project, the computational acceleration will be realized by making use of the intrinsic parallelism offered by the sampling process. Both the memory and the arithmetic bottlenecks of traditional approaches will be addressed. First, a logic circuit based technique will be developed to represent probabilities, and thereby greatly reduce the memory utilization of the algorithm. Second, powerful new arithmetic techniques will be explored to achieve area-efficient computations for the newly proposed number representation. Third, a new sampling method, that is friendly to circuit implementation, will be investigated. Fourth, an approximation technique will be studied to alleviate the complexity arising from tracing sampling histories. Finally, path-aware parallel sampling will be exploited to avoid the redundant computations in software implementations. These techniques and their overall effectiveness will be validated via experiments.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
许多机器学习技术的适用性仅限于非常具体、固定的应用环境。 与此相反,基于模型的贝叶斯强化学习技术是一个更复杂的框架,可以在不完全了解环境的情况下实现具有不断变化的目标的类人决策。然而,其计算复杂度非常高,因此其进展仅限于有限应用的小规模演示。该项目的目标是通过开发创新的算法-硬件协同设计技术来克服这一障碍。该研究成果预计将大大加速基于模型的贝叶斯强化学习的计算,适用于实际的大规模现实生活应用,特别是那些具有实时约束的应用。研究成果将惠及无人驾驶汽车、无人机、智能农业灌溉、救灾机器人、残疾人机器人助手等诸多直接影响社会的领域。该研究还将培训学生,包括女性和其他代表性不足的群体,为相关技术领域急需的美国劳动力提供培训。基于模型的贝叶斯强化学习的计算核心是对决策树进行随机采样。在该项目中,将通过利用采样过程提供的固有并行性来实现计算加速。传统方法的内存和算术瓶颈都将得到解决。首先,将开发基于逻辑电路的技术来表示概率,从而大大减少算法的内存利用率。其次,将探索强大的新算术技术,以实现新提出的数字表示的区域高效计算。第三,将研究一种有利于电路实现的新采样方法。第四,将研究近似技术以减轻跟踪采样历史所产生的复杂性。最后,将利用路径感知并行采样来避免软件实现中的冗余计算。这些技术及其整体有效性将通过实验进行验证。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Scaled Population Division for Approximate Computing
用于近似计算的规模化总体划分
Scaled Population Arithmetic for Efficient Stochastic Computing
Scaled Population Subtraction for Approximate Computing
TD3lite: FPGA Acceleration of Reinforcement Learning with Structural and Representation Optimizations
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Jiang Hu其他文献

Involvement of RbAp48 in erythroid differentiation of murine erythroleukemia cells induced by sodium butyrate
RbAp48参与丁酸钠诱导小鼠红白血病细胞向红系分化的研究
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    2.9
  • 作者:
    WU;Ling Cao;Jiang Hu;J. Xue;Ting;Ya;Tao Chen;Jie Wang;Fukun Zhao;Shi
  • 通讯作者:
    Shi
Central Limit Theorem for Mutual Information of Large MIMO Systems With Elliptically Correlated Channels
具有椭圆相关信道的大型MIMO系统互信息的中心极限定理
Multi-scale numerical simulation analysis for influence of combined leaching and frost deteriorations on mechanical properties of concrete
淋溶与霜冻联合劣化对混凝土力学性能影响的多尺度数值模拟分析
Nonlinear finite-element-based structural system failure probability analysis methodology for gravity dams considering correlated failure modes
考虑相关失效模式的重力坝非线性有限元结构系统失效概率分析方法
Comprehensive investigation of leakage problems for concrete gravity dams with penetrating cracks based on detection and monitoring data: A case study
基于检测监测数据的混凝土重力坝贯穿裂缝渗漏问题综合排查——以案例研究

Jiang Hu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Jiang Hu', 18)}}的其他基金

Travel: Workshop on Shared Infrastructure for Machine Learning Electronic Design Automation
旅行:机器学习电子设计自动化共享基础设施研讨会
  • 批准号:
    2310319
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Medium: Automated energy-efficient sensor data winnowing using native analog processing
协作研究:SHF:中:使用本机模拟处理进行自动节能传感器数据筛选
  • 批准号:
    2212346
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
Collaborative Research: SHF: Medium: Revitalizing EDA from a Machine Learning Perspective
合作研究:SHF:媒介:从机器学习的角度振兴 EDA
  • 批准号:
    2106725
  • 财政年份:
    2021
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
STARSS: Small: Collaborative: Physical Design for Secure Split Manufacturing of ICs
STARSS:小型:协作:IC 安全分割制造的物理设计
  • 批准号:
    1618824
  • 财政年份:
    2016
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
SHF: Small: Collaborative Research: Variation-Resilient VLSI Systems with Cross-Layer Controlled Approximation
SHF:小型:协作研究:具有跨层控制逼近的抗变化 VLSI 系统
  • 批准号:
    1525749
  • 财政年份:
    2015
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Design Automation for Cost-Effective Implementation of Adaptive Integrated Circuits
用于经济高效地实现自适应集成电路的设计自动化
  • 批准号:
    1255193
  • 财政年份:
    2013
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

CSR: Small: Multi-FPGA System for Real-time Fraud Detection with Large-scale Dynamic Graphs
CSR:小型:利用大规模动态图进行实时欺诈检测的多 FPGA 系统
  • 批准号:
    2317251
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: AF: Small: Real Solutions of Polynomial Systems
合作研究:AF:小:多项式系统的实数解
  • 批准号:
    2331401
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CC* Integration-Small: Network-Aware Edge Computing for Real-time Wildfire Detection
CC* Integration-Small:用于实时野火检测的网络感知边缘计算
  • 批准号:
    2346755
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: AF: Small: Real Solutions of Polynomial Systems
合作研究:AF:小:多项式系统的实数解
  • 批准号:
    2331400
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
NSF-BSF: NeTS: Small: Making BGP work for real-time interactive applications
NSF-BSF:NeTS:小型:使 BGP 适用于实时交互式应用程序
  • 批准号:
    2344761
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: Multiple Device Collaborative Learning in Real Heterogeneous and Dynamic Environments
III:小:真实异构动态环境中的多设备协作学习
  • 批准号:
    2311990
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CSR: Small: Enhancing Timeliness and Power-Efficiency of Real-Time Data Services
CSR:小:提高实时数据服务的及时性和能效
  • 批准号:
    2326796
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
SHF: Core: Small: Real-time and Energy-Efficient Machine Learning for Robotics Applications
SHF:核心:小型:用于机器人应用的实时且节能的机器学习
  • 批准号:
    2341183
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CC* Integration-Small: Network cyberinfrastructure innovation with an intelligent real-time traffic analysis framework and application-aware networking
CC* Integration-Small:网络基础设施创新,具有智能实时流量分析框架和应用感知网络
  • 批准号:
    2322369
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Comprehensive, Real Time Monitoring of the Accumulation and Clearance of Small Molecules in Kidney Disease
全面、实时监测肾脏疾病中小分子的积累和清除
  • 批准号:
    10863011
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了