Risk-sensitive choice and reinforcement learning under uncertainty
不确定性下的风险敏感选择与强化学习
基本信息
- 批准号:407012307
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:德国
- 项目类别:Research Grants
- 财政年份:2018
- 资助国家:德国
- 起止时间:2017-12-31 至 2021-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Many real-life decisions must be made in the face of risk that is due to uncertain information about the choice situation. At least two types of uncertainty can result in decision risk: (1) the uncertain consequences of the decision maker’s choice and (2) the decision maker’s uncertain knowledge about the choice situation. In effect, both types of uncertainty can impact the economic consequences of a decision and thus result in risk. We refer to these types of risk as “economic risk” and "perceptual risk". While the neural mechanisms underlying economic risk processing are fairly well established for static conditions and in the absence of perceptual uncertainty, the cognitive and neural processes underlying the acquisition of economic and perceptual risk-sensitive decision strategies are less clear. In the proposed project, we build on our recent computational work in the development of risk-sensitive Markov decision processes and reinforcement learning algorithms to investigate the cognitive and neural mechanisms of encoding economic and perceptual risk. At the theoretical level, this entails the adaptation of a risk-sensitive partially-observable Markov decision process (POMDP) framework as a behavioral model for human response times and choices. At the experimental level, it entails the empirical validation of the framework in two behavioral and one fMRI experiments. We will pursue these aims in three work packages. In the first work package, we will build on our previous theoretical work to derive novel model-free reinforcement learning algorithms that account for both economic and perceptual risk. In our second work package, we will test the hypothesis that the risk-sensitive POMDP framework will surpass previous approaches in capturing human response time behavior. In the third work package, we will use fMRI to identify the neural underpinnings of economic and perceptual risk processing. Overall, our project will extend previous work on risk-sensitive learning and decision making to the presence of perceptual uncertainty.
许多现实生活中的决策必须面对风险,这是由于不确定的信息选择的情况。至少有两种类型的不确定性会导致决策风险:(1)决策者选择的不确定后果;(2)决策者对选择情况的不确定知识。实际上,这两种类型的不确定性都可能影响决策的经济后果,从而导致风险。我们将这些风险称为“经济风险”和“感知风险”。虽然经济风险处理的神经机制是相当好的建立静态条件下,在知觉的不确定性的情况下,认知和神经过程的收购经济和知觉的风险敏感的决策策略是不太清楚。在拟议的项目中,我们建立在我们最近的计算工作,在风险敏感的马尔可夫决策过程和强化学习算法的发展,以调查编码经济和感知风险的认知和神经机制。在理论层面,这需要将风险敏感的部分可观察马尔可夫决策过程(POMDP)框架调整为人类响应时间和选择的行为模型。在实验层面,它需要在两个行为和一个功能磁共振成像实验的框架的实证验证。我们将通过三个工作包来实现这些目标。在第一个工作包中,我们将建立在我们以前的理论工作基础上,推导出新颖的无模型强化学习算法,该算法同时考虑了经济和感知风险。在我们的第二个工作包中,我们将测试风险敏感的POMDP框架将超过以前的方法在捕捉人类响应时间行为的假设。在第三个工作包中,我们将使用功能磁共振成像来识别经济和感知风险处理的神经基础。总的来说,我们的项目将把以前关于风险敏感学习和决策的工作扩展到感知不确定性的存在。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Professor Dr. Klaus Obermayer其他文献
Professor Dr. Klaus Obermayer的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Professor Dr. Klaus Obermayer', 18)}}的其他基金
Risk-sensitive decision making under inclomplete information
综合信息下的风险敏感决策
- 批准号:
339441241 - 财政年份:2017
- 资助金额:
-- - 项目类别:
Research Grants
Linking metric and symbolic levels in autonomous reinforcement learning
连接自主强化学习中的度量和符号级别
- 批准号:
200282059 - 财政年份:2011
- 资助金额:
-- - 项目类别:
Priority Programmes
Lernende Software-Agenten zur Filterung von Textdokumenten
用于过滤文本文档的学习软件代理
- 批准号:
5445934 - 财政年份:2005
- 资助金额:
-- - 项目类别:
Research Grants
Neuronale biologisch inspirierte Steuerungsachitektur für einen mobilen Roboter
移动机器人的神经生物学控制架构
- 批准号:
5418869 - 财政年份:2004
- 资助金额:
-- - 项目类别:
Research Grants
Quantitative Erfassung der Entwicklungsdynamik von identifizierten Neuronen bei Insekten
昆虫中已识别神经元发育动力学的定量评估
- 批准号:
5205534 - 财政年份:1999
- 资助金额:
-- - 项目类别:
Research Grants
Optimal Control of Models of Neural Population Dynamics
神经群体动力学模型的最优控制
- 批准号:
523380209 - 财政年份:
- 资助金额:
-- - 项目类别:
Research Grants
相似国自然基金
基于压力敏感肾单位微流控芯片的肾上皮细胞CAT1-mTOR通路在梗阻性肾损伤中的作用机制研究
- 批准号:82370678
- 批准年份:2023
- 资助金额:49.00 万元
- 项目类别:面上项目
淫羊藿苷拮抗内源性甲醛神经毒性的作用及机制研究
- 批准号:81102683
- 批准年份:2011
- 资助金额:22.0 万元
- 项目类别:青年科学基金项目
二甲双胍对肥胖自发2型糖尿病大鼠脂肪分解变化规律的影响及机制
- 批准号:81000347
- 批准年份:2010
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
智能控温兼控释药多法治癌用磁性聚合物微球
- 批准号:50702037
- 批准年份:2007
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
染色体22q上对RNA编辑酶敏感的胶质瘤相关基因的筛选
- 批准号:30672159
- 批准年份:2006
- 资助金额:30.0 万元
- 项目类别:面上项目
相似海外基金
Establishing the Repertoire of Actionable Alterations in Appendiceal Adenocarcinoma
建立阑尾腺癌可行的改变方案
- 批准号:
10366469 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Establishing the Repertoire of Actionable Alterations in Appendiceal Adenocarcinoma
建立阑尾腺癌可行的改变方案
- 批准号:
10542791 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Elucidating the role of the gut metagenome in hypertension.
阐明肠道宏基因组在高血压中的作用。
- 批准号:
10271244 - 财政年份:2020
- 资助金额:
-- - 项目类别:
HL146818-Uric Acid, Klotho and Salt Sensitivity in Young Adults Born Preterm
HL146818-早产青年的尿酸、Klotho 和盐敏感性
- 批准号:
10175748 - 财政年份:2019
- 资助金额:
-- - 项目类别:
Overcoming EMT-driven metastatic castration-resistant prostate cancer
克服 EMT 驱动的转移性去势抵抗性前列腺癌
- 批准号:
9377994 - 财政年份:2017
- 资助金额:
-- - 项目类别:
Elucidating a novel molecular biomarker for castration-resistant prostate cancer
阐明去势抵抗性前列腺癌的新型分子生物标志物
- 批准号:
10640684 - 财政年份:2012
- 资助金额:
-- - 项目类别:
fMRI investigations of how we learn what is relevant for a decision
功能磁共振成像研究我们如何了解与决策相关的内容
- 批准号:
8048585 - 财政年份:2011
- 资助金额:
-- - 项目类别:
EAPSI: Examining Barriers to Realizing Water Sensitive Urban Design: Household Landscaping Perceptions and Choice in spite of Long-term Drought and Conservation Education
EAPSI:审查实现水敏感型城市设计的障碍:尽管长期干旱和保护教育,家庭景观美化的看法和选择
- 批准号:
1015610 - 财政年份:2010
- 资助金额:
-- - 项目类别:
Fellowship Award
Smoked Marijuana Discrimination and Marijuana Choice in Humans: A Laboratory Mode
人类吸食大麻的歧视和大麻选择:实验室模式
- 批准号:
7864258 - 财政年份:2009
- 资助金额:
-- - 项目类别:
Smoked Marijuana Discrimination and Marijuana Choice in Humans: A Laboratory Mode
人类吸食大麻的歧视和大麻选择:实验室模式
- 批准号:
7686631 - 财政年份:2009
- 资助金额:
-- - 项目类别: