A computational approach that evaluates the value calculation process and the choice process in decision making
评估决策中的价值计算过程和选择过程的计算方法
基本信息
- 批准号:18K13366
- 负责人:
- 金额:$ 2.66万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Early-Career Scientists
- 财政年份:2018
- 资助国家:日本
- 起止时间:2018-04-01 至 2021-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
项目成果
期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
忘却過程のある強化学習モデルの提案
提出具有遗忘过程的强化学习模型
- DOI:
- 发表时间:2019
- 期刊:
- 影响因子:0
- 作者:Akitsugu Konno;Hitomi Aoki;Emiri Suzuki;Seiya Furuta;Sayoko Ueda;馬場ひとみ・谷口由香莉・鈴木美樹江・肥田幸子・大塚敬子・加藤大樹;遠山朝子
- 通讯作者:遠山朝子
Reinforcement learning with parsimonious computation and a forgetting process
具有简约计算和遗忘过程的强化学习
- DOI:10.3389/fnhum.2019.00153
- 发表时间:2019
- 期刊:
- 影响因子:2.9
- 作者:Toyama Asako;Katahira Kentaro;Ohira Hideki
- 通讯作者:Ohira Hideki
忘却過程を含む強化学習モデルを用いたモデルフリー・モデルベースシステム比重の推定
使用强化学习模型(包括遗忘过程)估计无模型和基于模型的系统引力
- DOI:
- 发表时间:2019
- 期刊:
- 影响因子:0
- 作者:趙朔;魚野翔太;義村さや香;十一元三;大隅 尚広;遠山朝子
- 通讯作者:遠山朝子
Biases in estimating the balance between model-free and model-based learning systems due to model misspecification
由于模型指定错误,在估计无模型和基于模型的学习系统之间的平衡时存在偏差
- DOI:10.1016/j.jmp.2019.03.007
- 发表时间:2019
- 期刊:
- 影响因子:1.8
- 作者:Toyama Asako;Katahira Kentaro;Ohira Hideki
- 通讯作者:Ohira Hideki
Forgetting Process in Model-Free and Model-Based Reinforcement Learning.
无模型和基于模型的强化学习中的遗忘过程。
- DOI:
- 发表时间:2019
- 期刊:
- 影响因子:0
- 作者:Toyama;A.;Katahira;K.;& Ohira;H.
- 通讯作者:H.
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Toyama Asako其他文献
発達障害者へのロボットを用いた支援の潜在性
使用机器人为发育障碍人士提供支持的潜力
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
Katahira Kentaro;Toyama Asako;熊﨑博一 - 通讯作者:
熊﨑博一
高時間解像度による映像提示が運動知覚に与える影響
高时间分辨率视频呈现对运动感知的影响
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
Toyama Asako;Katahira Kentaro;Ohira Hideki;中嶋豊・宮下優衣 - 通讯作者:
中嶋豊・宮下優衣
顔特性推論の極端さはステレオタイプ化傾向と関連する
面部特征推断的极端性与刻板印象倾向相关
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
Toyama Asako;Katahira Kentaro;Ohira Hideki;鈴木敦命・塚本早織・高橋雄介 - 通讯作者:
鈴木敦命・塚本早織・高橋雄介
脳と身体の予測的符号化とその不全―守谷・国里・杉浦論文へのコメント―
大脑和身体的预测编码及其失败 - 对 Moriya、Kunisato 和 Sugiura 论文的评论 -
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
Toyama Asako;Katahira Kentaro;Ohira Hideki;大平英樹 - 通讯作者:
大平英樹
脳神経組織のホメオスタシス維持を担う生体システム
负责维持脑神经组织稳态的生物系统
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
Toyama Asako;Katahira Kentaro;Ohira Hideki;村松里衣子 - 通讯作者:
村松里衣子
Toyama Asako的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
Learning to Reason in Reinforcement Learning
在强化学习中学习推理
- 批准号:
DP240103278 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Discovery Projects
Collaborative Research: CDS&E: Generalizable RANS Turbulence Models through Scientific Multi-Agent Reinforcement Learning
合作研究:CDS
- 批准号:
2347423 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Standard Grant
CAREER: Stochasticity and Resilience in Reinforcement Learning: From Single to Multiple Agents
职业:强化学习中的随机性和弹性:从单个智能体到多个智能体
- 批准号:
2339794 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Continuing Grant
強化学習モデル・ネットワーク分析によるサイコパシーの情報処理メカニズムの解明
利用强化学习模型和网络分析阐明精神病态的信息处理机制
- 批准号:
24K16865 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
CAREER: Towards Real-world Reinforcement Learning
职业:走向现实世界的强化学习
- 批准号:
2339395 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Continuing Grant
CAREER: Robust Reinforcement Learning Under Model Uncertainty: Algorithms and Fundamental Limits
职业:模型不确定性下的鲁棒强化学习:算法和基本限制
- 批准号:
2337375 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Continuing Grant
Optimizing Intelligent Vehicular Routing with Edge Computing through Multi-Agent Reinforcement Learning
通过多智能体强化学习利用边缘计算优化智能车辆路由
- 批准号:
24K14913 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
CAREER: Temporal Causal Reinforcement Learning and Control for Autonomous and Swarm Cyber-Physical Systems
职业:自治和群体网络物理系统的时间因果强化学习和控制
- 批准号:
2339774 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Continuing Grant
Federated Reinforcement Learning Empowered Point Cloud Video Streaming
联合强化学习赋能点云视频流
- 批准号:
24K14927 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Collaborative Research: CDS&E: Generalizable RANS Turbulence Models through Scientific Multi-Agent Reinforcement Learning
合作研究:CDS
- 批准号:
2347422 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Standard Grant














{{item.name}}会员




