Collaborative: RI: Feature Discovery and Benchmarks for Exportable Reinforcement Learning
协作:RI:可导出强化学习的特征发现和基准
基本信息
- 批准号:0713435
- 负责人:
- 金额:$ 22.5万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2007
- 资助国家:美国
- 起止时间:2007-10-01 至 2011-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Collaborative Proposal pair: 0713435 (Lead) & 0713148"Collaborative: RI: Feature Discovery and Benchmarks for exportable Reinforcement Learning"PI: Ronald Parr, Duke UniversityPI: Michael L. Littman, Rutgers UniversityABSTRACTThis project focuses on several aspects of automated feature discovery in the context of reinforcement learning. Badly chosen features cause reinforcement-learning algorithms to fail and, as such, only individuals skilled in feature construction can create successful reinforcement-learning systems for novel tasks. This issue underscores two shortcomings in existing research. First, most existing reinforcement-learning methods cannot generate or discover features automatically and robustly. Second, existing benchmark problems and paradigms for benchmarking do not distinguish adequately between clever algorithm design and clever feature engineering.This project addresses these challenges in two-pronged approach. The first prong aims to advance a technical agenda leading to a new approach to feature discovery and model representation. The second prong is the development of a benchmark methodology and repository with a different focus and structure from existing endeavors. The goal for the benchmarking effort will be to produce a set of fair and reproducible experiments that will help elucidate the strengths and weaknesses of existing approaches, while simultaneously introducing challenges to motivate the development of new approaches.
协作提案对:0713435(主要)&;0713148“协作:RI:可输出强化学习的特征发现和基准”PI:罗纳德·帕尔,杜克大学PI:迈克尔·L·利特曼,罗格斯大学摘要本项目关注强化学习背景下自动特征发现的几个方面。选择不当的特征会导致强化学习算法失败,因此,只有擅长构建特征的个人才能为新任务创建成功的强化学习系统。这个问题突出了现有研究中的两个缺陷。首先,大多数现有的强化学习方法不能自动和稳健地生成或发现特征。第二,现有的基准问题和基准测试的范例没有充分区分聪明的算法设计和聪明的特征工程。本项目从双管齐下解决这些挑战。第一个目标是推进一项技术议程,从而产生一种新的特征发现和模型表示方法。第二个方面是开发与现有工作不同的重点和结构的基准方法和存储库。基准工作的目标将是产生一套公平和可重复的实验,这些实验将有助于阐明现有方法的优缺点,同时引入挑战,以推动新方法的开发。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Ronald Parr其他文献
Amazing Things Come From Having Many Good Models
令人惊奇的事情来自于拥有许多好的模型
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
Cynthia Rudin;Chudi Zhong;Lesia Semenova;Margo Seltzer;Ronald Parr;Jiachang Liu;Srikar Katta;Jon Donnelly;Harry Chen;Zachery Boner - 通讯作者:
Zachery Boner
An Optimal Tightness Bound for the Simulation Lemma
模拟引理的最优紧界
- DOI:
- 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Sam Lobel;Ronald Parr - 通讯作者:
Ronald Parr
Ronald Parr的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Ronald Parr', 18)}}的其他基金
RI: Small: Feature Encoding for Reinforcement Learning
RI:小型:强化学习的特征编码
- 批准号:
1815300 - 财政年份:2018
- 资助金额:
$ 22.5万 - 项目类别:
Continuing Grant
EAGER: Collaborative Research: An Unified Learnable Roadmap for Sequential Decision Making in Relational Domains
EAGER:协作研究:关系领域顺序决策的统一可学习路线图
- 批准号:
1836575 - 财政年份:2018
- 资助金额:
$ 22.5万 - 项目类别:
Standard Grant
RI: Small: Non-parametric Approximate Dynamic Programming for Continuous Domains
RI:小:连续域的非参数近似动态规划
- 批准号:
1218931 - 财政年份:2012
- 资助金额:
$ 22.5万 - 项目类别:
Standard Grant
EAGER: IIS: RI: Learning in Continuous and High Dimensional Action Spaces
EAGER:IIS:RI:在连续和高维行动空间中学习
- 批准号:
1147641 - 财政年份:2011
- 资助金额:
$ 22.5万 - 项目类别:
Standard Grant
CAREER: Observing to Plan - Planning to Observe
职业生涯:观察到计划 - 计划到观察
- 批准号:
0546709 - 财政年份:2006
- 资助金额:
$ 22.5万 - 项目类别:
Continuing Grant
Prediction and Planning: Bridging the Gap
预测和规划:弥合差距
- 批准号:
0209088 - 财政年份:2002
- 资助金额:
$ 22.5万 - 项目类别:
Standard Grant
相似国自然基金
醒脑静多靶点调控PI3K/Akt通路抑制CI/RI氧化应激—基于网络药理学及体内、外实验研究
- 批准号:2025JJ90117
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
IgA-FcαRI介导的Syk/NLRP3/caspase-1通路在线状IgA大疱性皮病
中的机制研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于双修饰ANG-RNH1系统阻抑RI复合物生成机制建立口腔黏膜等效物血管化稳态
- 批准号:82401112
- 批准年份:2024
- 资助金额:30 万元
- 项目类别:青年科学基金项目
跨膜蛋白LRP5胞外域调控膜受体TβRI促钛表面BMSCs归巢、分化的研究
- 批准号:82301120
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于“免疫-神经”网络探讨眼针活化CI/RI大鼠MC靶向H3R调节“免疫监视”的抗炎机制
- 批准号:82374375
- 批准年份:2023
- 资助金额:51 万元
- 项目类别:面上项目
Dectin-2通过促进FcεRI聚集和肥大细胞活化加剧哮喘发作的机制研究
- 批准号:82300022
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
藏药甘肃蚤缀β-咔啉生物碱类TβRI抑制剂的发现及其抗肺纤维化作用机制研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
nCs通过TβRI结合并磷酸化Axin促进颌骨成骨反应的作用及机制研究
- 批准号:2022J011347
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
TβRI的UFM化修饰调控TGF-β信号通路和乳腺癌转移的作用及机制研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于 FcεRI 信号通路介导的肥大细胞脱颗粒过程研究支气管哮喘的机制及中药干预
- 批准号:2022JJ70115
- 批准年份:2022
- 资助金额:0.0 万元
- 项目类别:省市级项目
相似海外基金
CRII: RI: Deep neural network pruning for fast and reliable visual detection in self-driving vehicles
CRII:RI:深度神经网络修剪,用于自动驾驶车辆中快速可靠的视觉检测
- 批准号:
2412285 - 财政年份:2024
- 资助金额:
$ 22.5万 - 项目类别:
Standard Grant
Research Infrastructure: Mid-scale RI-1 (MI:IP): X-rays for Life Sciences, Environmental Sciences, Agriculture, and Plant sciences (XLEAP)
研究基础设施:中型 RI-1 (MI:IP):用于生命科学、环境科学、农业和植物科学的 X 射线 (XLEAP)
- 批准号:
2330043 - 财政年份:2024
- 资助金额:
$ 22.5万 - 项目类别:
Cooperative Agreement
NSF Engines Development Award: Accelerating A Just Energy Transition Through Innovative Nature-Inclusive Offshore Wind Farms (CT,DE,MA,MD,NJ,RI,VA)
NSF 发动机开发奖:通过创新的自然包容性海上风电场加速公正的能源转型(康涅狄格州、特拉华州、马里兰州、马里兰州、新泽西州、罗德岛州、弗吉尼亚州)
- 批准号:
2315558 - 财政年份:2024
- 资助金额:
$ 22.5万 - 项目类别:
Cooperative Agreement
新しい口腔癌センチネルリンパ節マッピング法の確立-RI法との非劣性試験-
口腔癌前哨淋巴结定位新方法的建立-RI法非劣效性检验-
- 批准号:
24K20038 - 财政年份:2024
- 资助金额:
$ 22.5万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
RIビームを用いた医療用At-211製造技術の開発
使用 RI 光束开发医用 At-211 制造技术
- 批准号:
23K25132 - 财政年份:2024
- 资助金额:
$ 22.5万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
医療用RIの大量製造に向けた大強度He二価ECRイオン源の研究開発
医用RI量产用高强度He二价ECR离子源研发
- 批准号:
24KJ1107 - 财政年份:2024
- 资助金额:
$ 22.5万 - 项目类别:
Grant-in-Aid for JSPS Fellows
Mass measurements of Ag and Pd isotopes with the Rare RI-Ring for the 2nd peak of the r-process abundance
使用 Rare RI 环对 r 过程丰度的第二个峰进行 Ag 和 Pd 同位素的质量测量
- 批准号:
23K22509 - 财政年份:2024
- 资助金额:
$ 22.5万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
RI: Small: Understanding Hand Interaction In The Jumble of Internet Videos
RI:小:在混乱的互联网视频中理解手部交互
- 批准号:
2426592 - 财政年份:2024
- 资助金额:
$ 22.5万 - 项目类别:
Standard Grant
減速RIビームを用いたフェムト・スケール量子系における相転移現象の研究
使用减速 RI 光束研究飞秒级量子系统中的相变现象
- 批准号:
24H00239 - 财政年份:2024
- 资助金额:
$ 22.5万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
Collaborative Research: RI: Medium: Principles for Optimization, Generalization, and Transferability via Deep Neural Collapse
合作研究:RI:中:通过深度神经崩溃实现优化、泛化和可迁移性的原理
- 批准号:
2312841 - 财政年份:2023
- 资助金额:
$ 22.5万 - 项目类别:
Standard Grant