RI: Small: Collaborative Research: Speeding Up Learning through Modeling the Pragmatics of Training
RI:小型:协作研究:通过培训语用建模加速学习
基本信息
- 批准号:1319412
- 负责人:
- 金额:$ 13.5万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2013
- 资助国家:美国
- 起止时间:2013-10-01 至 2016-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Years of effort to develop algorithms capable of learning from reward signals have resulted in a plethora of techniques that can leverage numerical signals that vary in value based on performance. Recent efforts to use these techniques to learn from humans providing rewards have been slower to progress, in part, because humans give feedback discretely rather than numerically. This project contributes new learning algorithms designed specifically to leverage the information contained in the choices humans make to provide such discrete feedbacks. The algorithms are inspired by the human-canine partnership, and the incredible things that humans are able to teach dogs using only discrete feedback and carefully constructed sequences of tasks. The Bayesian learning framework being developed in this project will leverage the pragmatic implicatures contained in the feedbacks and tasks sequences to learn more quickly from human feedback. The ultimate goal of this work is to provide a more natural paradigm for humans to tell computers what they would like for them to do. To that end, project efforts will result in a teaching module for Brown University?s Learning Exchange (LE). The LE involves undergraduates working with underserved minority middle school students to engage them in STEM. They are a perfect audience to demonstrate the broader impacts of this work. LE participants learn to instruct computers using a combination of programming with the Scratch environment and the feedback paradigm, which shows how powerful the algorithms are.
多年来,开发能够从奖励信号中学习的算法的努力已经产生了大量的技术,这些技术可以利用基于性能而变化的数值信号。最近使用这些技术向提供奖励的人类学习的努力进展缓慢,部分原因是人类提供的反馈是离散的,而不是数字。这个项目贡献了新的学习算法,专门用来利用人类做出的选择中包含的信息来提供这种离散的反馈。这些算法的灵感来自于人类与狗的伙伴关系,以及人类仅使用离散反馈和精心构建的任务序列就能够教狗的令人难以置信的事情。贝叶斯学习框架将利用反馈和任务序列中包含的语用含义,更快地从人类反馈中学习。这项工作的最终目标是为人类提供一个更自然的范例,告诉计算机他们想让他们做什么。为此,项目工作将为布朗大学编制一个教学单元。的学习交流(LE)。LE涉及本科生与服务不足的少数民族中学生合作,让他们参与STEM。他们是展示这项工作更广泛影响的完美观众。LE参与者学习使用Scratch环境和反馈范式的编程组合来指导计算机,这表明算法是多么强大。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Matthew Taylor其他文献
Radiation‐induced apoptosis in MOLT‐4 cells requires de novo protein synthesis independent of de novo RNA synthesis
MOLT-4细胞中辐射诱导的细胞凋亡需要从头合成蛋白质,独立于从头RNA合成
- DOI:
- 发表时间:
2002 - 期刊:
- 影响因子:3.5
- 作者:
Matthew Taylor;M. Buckwalter;Amen Craig Stephenson;Janet Leigh Hart;Benjamin James Taylor;K. O’Neill - 通讯作者:
K. O’Neill
Ketamine PCA for Treatment of End-of-Life Neuropathic Pain in Pediatrics
氯胺酮 PCA 用于治疗儿科临终神经病理性疼痛
- DOI:
10.1177/1049909114543640 - 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
Matthew Taylor;R. Jakacki;Carol May;D. Howrie;Scott H. Maurer - 通讯作者:
Scott H. Maurer
Anti-fouling Medical Coatings
防污医用涂料
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
Jun Li;Matthew Taylor;Zheng Zhang - 通讯作者:
Zheng Zhang
Warm protons at comet 67P/Churyumov-Gerasimenko – Implications for the infant bow shock
67P/Churyumov-Gerasimenko 彗星上的暖质子——对婴儿弓激波的影响
- DOI:
10.5194/angeo-2020-66 - 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
C. Goetz;H. Gunell;F. L. Johansson;K. Llera;H. Nilsson;K. Glassmeier;Matthew Taylor - 通讯作者:
Matthew Taylor
Cluster Technical Challenges and Scientific Achievements
集群技术挑战和科学成果
- DOI:
10.1007/978-3-319-03952-7_30 - 发表时间:
2015 - 期刊:
- 影响因子:2.7
- 作者:
C. Escoubet;A. Masson;H. Laakso;Matthew Taylor;J. Volpp;D. Sieg;M. Hapgood;M. Goldstein - 通讯作者:
M. Goldstein
Matthew Taylor的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Matthew Taylor', 18)}}的其他基金
DISES: Indigenous forest management in a non-stationary climate
疾病:不稳定气候下的本土森林管理
- 批准号:
2310797 - 财政年份:2023
- 资助金额:
$ 13.5万 - 项目类别:
Standard Grant
Pilot study to develop a novel model to investigate the mechanisms and consequences of foetal immune programming on immune fitness through life
初步研究开发一种新模型来研究胎儿免疫编程对一生免疫健康的机制和后果
- 批准号:
BB/S002987/1 - 财政年份:2018
- 资助金额:
$ 13.5万 - 项目类别:
Research Grant
EAGER: Income Learning: A New Model for Behavior-Analysis-Inspired Learning from Human Feedback
EAGER:收入学习:基于人类反馈的行为分析启发学习的新模型
- 批准号:
1643614 - 财政年份:2016
- 资助金额:
$ 13.5万 - 项目类别:
Standard Grant
Doctoral Mentoring Consortium at the Fourteenth International Conference on Autonomous Agents and Multi-Agent Systems (AAMAS-16)
第十四届自主代理和多代理系统国际会议 (AAMAS-16) 博士生导师联盟
- 批准号:
1620841 - 财政年份:2016
- 资助金额:
$ 13.5万 - 项目类别:
Standard Grant
19th Annual SIGART/AAAI Doctoral Consortium
第 19 届年度 SIGART/AAAI 博士联盟
- 批准号:
1444754 - 财政年份:2014
- 资助金额:
$ 13.5万 - 项目类别:
Standard Grant
Mechanisms of Th2 cell-intrinsic hypo-responsiveness, and its impact on protective immunity and memory to parasitic helminths
Th2细胞固有低反应机制及其对寄生虫保护性免疫和记忆的影响
- 批准号:
MR/K020196/1 - 财政年份:2013
- 资助金额:
$ 13.5万 - 项目类别:
Research Grant
CAREER: A Multiagent Teacher/Student Framework for Sequential Decision Making Tasks
职业:用于顺序决策任务的多智能体教师/学生框架
- 批准号:
1348109 - 财政年份:2013
- 资助金额:
$ 13.5万 - 项目类别:
Standard Grant
Collaborative Research: Reconstructing Droughts in the Tropical Americas Using Tree-Ring Analysis
合作研究:利用树木年轮分析重建热带美洲的干旱
- 批准号:
1263517 - 财政年份:2013
- 资助金额:
$ 13.5万 - 项目类别:
Continuing Grant
EAAI-12: The Third Symposium on Educational Advances in AI
EAAI-12:第三届人工智能教育进展研讨会
- 批准号:
1231124 - 财政年份:2012
- 资助金额:
$ 13.5万 - 项目类别:
Standard Grant
CAREER: A Multiagent Teacher/Student Framework for Sequential Decision Making Tasks
职业:用于顺序决策任务的多智能体教师/学生框架
- 批准号:
1149917 - 财政年份:2012
- 资助金额:
$ 13.5万 - 项目类别:
Standard Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
Collaborative Research: RI: Small: Foundations of Few-Round Active Learning
协作研究:RI:小型:少轮主动学习的基础
- 批准号:
2313131 - 财政年份:2023
- 资助金额:
$ 13.5万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: Deep Constrained Learning for Power Systems
合作研究:RI:小型:电力系统的深度约束学习
- 批准号:
2345528 - 财政年份:2023
- 资助金额:
$ 13.5万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: Motion Fields Understanding for Enhanced Long-Range Imaging
合作研究:RI:小型:增强远程成像的运动场理解
- 批准号:
2232298 - 财政年份:2023
- 资助金额:
$ 13.5万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: End-to-end Learning of Fair and Explainable Schedules for Court Systems
合作研究:RI:小型:法院系统公平且可解释的时间表的端到端学习
- 批准号:
2232055 - 财政年份:2023
- 资助金额:
$ 13.5万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: End-to-end Learning of Fair and Explainable Schedules for Court Systems
合作研究:RI:小型:法院系统公平且可解释的时间表的端到端学习
- 批准号:
2232054 - 财政年份:2023
- 资助金额:
$ 13.5万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: Motion Fields Understanding for Enhanced Long-Range Imaging
合作研究:RI:小型:增强远程成像的运动场理解
- 批准号:
2232300 - 财政年份:2023
- 资助金额:
$ 13.5万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: Motion Fields Understanding for Enhanced Long-Range Imaging
合作研究:RI:小型:增强远程成像的运动场理解
- 批准号:
2232299 - 财政年份:2023
- 资助金额:
$ 13.5万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: End-to-end Learning of Fair and Explainable Schedules for Court Systems
合作研究:RI:小型:法院系统公平且可解释的时间表的端到端学习
- 批准号:
2334936 - 财政年份:2023
- 资助金额:
$ 13.5万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: Foundations of Few-Round Active Learning
协作研究:RI:小型:少轮主动学习的基础
- 批准号:
2313130 - 财政年份:2023
- 资助金额:
$ 13.5万 - 项目类别:
Standard Grant
RI: Small: Collaborative Research: Evolutionary Approach to Optimal Morphology and Control of Transformable Soft Robots
RI:小型:协作研究:可变形软机器人的最佳形态和控制的进化方法
- 批准号:
2325491 - 财政年份:2023
- 资助金额:
$ 13.5万 - 项目类别:
Standard Grant