RTML: Small: Real-Time Model-Based Bayesian Reinforcement Learning
RTML:小型:基于实时模型的贝叶斯强化学习
基本信息
- 批准号:1937396
- 负责人:
- 金额:$ 50万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2019
- 资助国家:美国
- 起止时间:2019-10-01 至 2023-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The applicability of many machine-learning techniques is limited to very specific, fixed application environments. As opposed to this, model-based Bayesian reinforcement learning technique is a more sophisticated framework, enabling human-like decision-making with evolving objectives and without complete knowledge of the environment. However, its computational complexity is very high, and consequently, its progress has been limited to small-scale demonstrations on limited applications. The goal of this project is to overcome this hurdle by developing innovative algorithm-hardware co-design techniques. The research outcome is expected to greatly accelerate the computation of model-based Bayesian reinforcement learning for practical, large-scale real-life applications, especially those with real-time constraints. The research results will benefit many fields that directly impact society, e.g., driver-less cars, unmanned aerial vehicles, smart agricultural irrigation, robotics for disaster relief and robotic assistants for handicapped people. The research will also train students, including women and other underrepresented groups, for the much needed U.S. workforce in related areas of technology.The computational kernel of model-based Bayesian reinforcement learning is random sampling over a decision tree. In this project, the computational acceleration will be realized by making use of the intrinsic parallelism offered by the sampling process. Both the memory and the arithmetic bottlenecks of traditional approaches will be addressed. First, a logic circuit based technique will be developed to represent probabilities, and thereby greatly reduce the memory utilization of the algorithm. Second, powerful new arithmetic techniques will be explored to achieve area-efficient computations for the newly proposed number representation. Third, a new sampling method, that is friendly to circuit implementation, will be investigated. Fourth, an approximation technique will be studied to alleviate the complexity arising from tracing sampling histories. Finally, path-aware parallel sampling will be exploited to avoid the redundant computations in software implementations. These techniques and their overall effectiveness will be validated via experiments.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
许多机器学习技术的适用性仅限于非常具体、固定的应用环境。与此相反,基于模型的贝叶斯强化学习技术是一个更复杂的框架,可以在不完全了解环境的情况下,通过不断变化的目标实现类似人类的决策。然而,它的计算复杂度非常高,因此,它的进展仅限于有限应用的小规模演示。该项目的目标是通过开发创新的算法-硬件协同设计技术来克服这一障碍。该研究成果有望大大加快基于模型的贝叶斯强化学习的计算速度,用于实际的、大规模的现实应用,特别是那些具有实时约束的应用。研究成果将惠及无人驾驶汽车、无人机、智能农业灌溉、救灾机器人、残疾人机器人助理等直接影响社会的领域。这项研究还将为相关技术领域急需的美国劳动力培训学生,包括女性和其他代表性不足的群体。基于模型的贝叶斯强化学习的计算核心是决策树上的随机抽样。在这个项目中,计算加速将利用采样过程提供的内在并行性来实现。将解决传统方法的内存和算术瓶颈。首先,将开发一种基于逻辑电路的技术来表示概率,从而大大降低算法的内存利用率。其次,将探索强大的新算术技术,以实现新提出的数字表示的面积高效计算。第三,研究一种便于电路实现的新采样方法。第四,将研究一种近似技术,以减轻跟踪采样历史所带来的复杂性。最后,利用路径感知并行采样来避免软件实现中的冗余计算。这些技术及其整体有效性将通过实验进行验证。该奖项反映了美国国家科学基金会的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Scaled Population Division for Approximate Computing
用于近似计算的规模化总体划分
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Kunal Bharathi
- 通讯作者:Kunal Bharathi
Scaled Population Arithmetic for Efficient Stochastic Computing
- DOI:10.1109/asp-dac47756.2020.9045292
- 发表时间:2020-01
- 期刊:
- 影响因子:0
- 作者:He Zhou;S. Khatri;Jiang Hu;Frank Liu
- 通讯作者:He Zhou;S. Khatri;Jiang Hu;Frank Liu
Scaled Population Subtraction for Approximate Computing
- DOI:10.1109/iccd50377.2020.00065
- 发表时间:2020-10
- 期刊:
- 影响因子:0
- 作者:K. Bharathi;Jiang Hu;S. Khatri
- 通讯作者:K. Bharathi;Jiang Hu;S. Khatri
TD3lite: FPGA Acceleration of Reinforcement Learning with Structural and Representation Optimizations
- DOI:10.1109/fpl57034.2022.00023
- 发表时间:2022-08
- 期刊:
- 影响因子:0
- 作者:Chan-Wei Hu;Jiangkun Hu;S. Khatri
- 通讯作者:Chan-Wei Hu;Jiangkun Hu;S. Khatri
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Jiang Hu其他文献
A new-nipponbare rice germplasm with high seed-setting rate.
高结实率日本晴水稻新种质.
- DOI:
10.1016/j.jgg.2014.07.001 - 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
Jiang Hu;Guojun Dong;Yunxia Fang;Yuchun Rao;Jie Xu;Dawei Xue;Haiping Yu;Chang;Zhenyuan Shi;Jiangjie Pan;Li Zhu;D. Zeng;Guangheng Zhang;Longbiao Guo;Q. Qian - 通讯作者:
Q. Qian
Comprehensive investigation of leakage problems for concrete gravity dams with penetrating cracks based on detection and monitoring data: A case study
基于检测监测数据的混凝土重力坝贯穿裂缝渗漏问题综合排查——以案例研究
- DOI:
10.1002/stc.2127 - 发表时间:
2018-04 - 期刊:
- 影响因子:5.4
- 作者:
Jiang Hu;Fuheng Ma;Suhua Wu - 通讯作者:
Suhua Wu
Multi-scale numerical simulation analysis for influence of combined leaching and frost deteriorations on mechanical properties of concrete
淋溶与霜冻联合劣化对混凝土力学性能影响的多尺度数值模拟分析
- DOI:
10.1108/mmms-03-2016-0013 - 发表时间:
2016 - 期刊:
- 影响因子:2
- 作者:
Jiang Hu - 通讯作者:
Jiang Hu
Nonlinear finite-element-based structural system failure probability analysis methodology for gravity dams considering correlated failure modes
考虑相关失效模式的重力坝非线性有限元结构系统失效概率分析方法
- DOI:
10.1007/s11771-017-3419-7 - 发表时间:
2017-02 - 期刊:
- 影响因子:4.4
- 作者:
Jiang Hu;Fuheng Ma;Suhua Wu - 通讯作者:
Suhua Wu
Error Analysis and Optimization in Approximate Arithmetic Circuits
近似算法电路的误差分析与优化
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
Deepashree Sengupta;Jiang Hu;S. Sapatnekar - 通讯作者:
S. Sapatnekar
Jiang Hu的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Jiang Hu', 18)}}的其他基金
Travel: Workshop on Shared Infrastructure for Machine Learning Electronic Design Automation
旅行:机器学习电子设计自动化共享基础设施研讨会
- 批准号:
2310319 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Medium: Automated energy-efficient sensor data winnowing using native analog processing
协作研究:SHF:中:使用本机模拟处理进行自动节能传感器数据筛选
- 批准号:
2212346 - 财政年份:2022
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
Collaborative Research: SHF: Medium: Revitalizing EDA from a Machine Learning Perspective
合作研究:SHF:媒介:从机器学习的角度振兴 EDA
- 批准号:
2106725 - 财政年份:2021
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
STARSS: Small: Collaborative: Physical Design for Secure Split Manufacturing of ICs
STARSS:小型:协作:IC 安全分割制造的物理设计
- 批准号:
1618824 - 财政年份:2016
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
SHF: Small: Collaborative Research: Variation-Resilient VLSI Systems with Cross-Layer Controlled Approximation
SHF:小型:协作研究:具有跨层控制逼近的抗变化 VLSI 系统
- 批准号:
1525749 - 财政年份:2015
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Design Automation for Cost-Effective Implementation of Adaptive Integrated Circuits
用于经济高效地实现自适应集成电路的设计自动化
- 批准号:
1255193 - 财政年份:2013
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
CSR: Small: Multi-FPGA System for Real-time Fraud Detection with Large-scale Dynamic Graphs
CSR:小型:利用大规模动态图进行实时欺诈检测的多 FPGA 系统
- 批准号:
2317251 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: Real Solutions of Polynomial Systems
合作研究:AF:小:多项式系统的实数解
- 批准号:
2331401 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CC* Integration-Small: Network-Aware Edge Computing for Real-time Wildfire Detection
CC* Integration-Small:用于实时野火检测的网络感知边缘计算
- 批准号:
2346755 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: Real Solutions of Polynomial Systems
合作研究:AF:小:多项式系统的实数解
- 批准号:
2331400 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
NSF-BSF: NeTS: Small: Making BGP work for real-time interactive applications
NSF-BSF:NeTS:小型:使 BGP 适用于实时交互式应用程序
- 批准号:
2344761 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CSR: Small: Enhancing Timeliness and Power-Efficiency of Real-Time Data Services
CSR:小:提高实时数据服务的及时性和能效
- 批准号:
2326796 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III: Small: Multiple Device Collaborative Learning in Real Heterogeneous and Dynamic Environments
III:小:真实异构动态环境中的多设备协作学习
- 批准号:
2311990 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
SHF: Core: Small: Real-time and Energy-Efficient Machine Learning for Robotics Applications
SHF:核心:小型:用于机器人应用的实时且节能的机器学习
- 批准号:
2341183 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CC* Integration-Small: Network cyberinfrastructure innovation with an intelligent real-time traffic analysis framework and application-aware networking
CC* Integration-Small:网络基础设施创新,具有智能实时流量分析框架和应用感知网络
- 批准号:
2322369 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Comprehensive, Real Time Monitoring of the Accumulation and Clearance of Small Molecules in Kidney Disease
全面、实时监测肾脏疾病中小分子的积累和清除
- 批准号:
10863011 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:














{{item.name}}会员




