Developing a theory of deep reinforcement learning equipped with bounded rationality

发展具有有限理性的深度强化学习理论

基本信息

  • 批准号:
    17H04696
  • 负责人:
  • 金额:
    $ 15.14万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (A)
  • 财政年份:
    2017
  • 资助国家:
    日本
  • 起止时间:
    2017-04-01 至 2020-03-31
  • 项目状态:
    已结题

项目摘要

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
満足化を通じた最適な自律的探索
通过满意度进行最优自主搜索
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    甲野 佑;高橋 達二
  • 通讯作者:
    高橋 達二
パリ第8大学/高等師範学校/高等研究実習院(フランス)
巴黎第八大学/巴黎高等师范学院/高等研究与培训学院(法国)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
ダーラム大学(英国)
杜伦大学(英国)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Extended Bayesian inference incorporating symmetry bias
结合对称偏差的扩展贝叶斯推理
  • DOI:
    10.1016/j.biosystems.2020.104104
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    1.6
  • 作者:
    Shinohara Shuji;Manome Nobuhito;Suzuki Kouta;Chung Ung-il;Takahashi Tatsuji;Gunji Pegio-Yukio;Nakajima Yoshihiro;Mitsuyoshi Shunji
  • 通讯作者:
    Mitsuyoshi Shunji
認知的満足化価値関数の分析
认知满足价值函数分析
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    玉造 晃弘;高橋 達二
  • 通讯作者:
    高橋 達二
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Takahashi Tatsuji其他文献

神経細胞の分散培養系による臨界的物理リザバー計算
使用神经元分布式培养系统进行关键物理储层计算
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Manome Nobuhito;Shinohara Shuji;Takahashi Tatsuji;Chen Yu;Chung Ung-il;諏訪瑛介,秋田大,池田成満,高野雄基,高橋宏知
  • 通讯作者:
    諏訪瑛介,秋田大,池田成満,高野雄基,高橋宏知
中心市街地における地域別特性から見た建物用途変化に関する調査 熊本市中心市街地の都市機能の特性 その1
中心城区区域特征视角下建筑用途变化调查 熊本市中心城区城市功能特征第1部分
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Shinohara Shuji;Manome Nobuhito;Suzuki Kouta;Chung Ung-il;Takahashi Tatsuji;Okamoto Hiroshi;Gunji Yukio Pegio;Nakajima Yoshihiro;Mitsuyoshi Shunji;森山愛海,古賀元也,豊田健太朗
  • 通讯作者:
    森山愛海,古賀元也,豊田健太朗
A Tentative Assumption of Electroacoustic Music as an Enjoyable Music for Diverse People
电声音乐作为一种适合不同人群享受的音乐的初步假设
考えるテーブル:Distance
思考表:距离
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Shinohara Shuji;Manome Nobuhito;Suzuki Kouta;Chung Ung-il;Takahashi Tatsuji;Gunji Pegio-Yukio;Nakajima Yoshihiro;Mitsuyoshi Shunji;Sawako Ogawa;佐藤弘夫;中川眞(甲斐賢治と共同発表)
  • 通讯作者:
    中川眞(甲斐賢治と共同発表)
A new method of Bayesian causal inference in non-stationary environments
非平稳环境下贝叶斯因果推理的新方法
  • DOI:
    10.1371/journal.pone.0233559
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    3.7
  • 作者:
    Shinohara Shuji;Manome Nobuhito;Suzuki Kouta;Chung Ung-il;Takahashi Tatsuji;Okamoto Hiroshi;Gunji Yukio Pegio;Nakajima Yoshihiro;Mitsuyoshi Shunji
  • 通讯作者:
    Mitsuyoshi Shunji

Takahashi Tatsuji的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Takahashi Tatsuji', 18)}}的其他基金

Proposal of Value Function Implementing Adaptive Cognitive Properties and Its Application to Large-Scale Computing
实现自适应认知特性的价值函数的提出及其在大规模计算中的应用
  • 批准号:
    25730150
  • 财政年份:
    2013
  • 资助金额:
    $ 15.14万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)

相似海外基金

Learning to Reason in Reinforcement Learning
在强化学习中学习推理
  • 批准号:
    DP240103278
  • 财政年份:
    2024
  • 资助金额:
    $ 15.14万
  • 项目类别:
    Discovery Projects
Collaborative Research: CDS&E: Generalizable RANS Turbulence Models through Scientific Multi-Agent Reinforcement Learning
合作研究:CDS
  • 批准号:
    2347423
  • 财政年份:
    2024
  • 资助金额:
    $ 15.14万
  • 项目类别:
    Standard Grant
CAREER: Stochasticity and Resilience in Reinforcement Learning: From Single to Multiple Agents
职业:强化学习中的随机性和弹性:从单个智能体到多个智能体
  • 批准号:
    2339794
  • 财政年份:
    2024
  • 资助金额:
    $ 15.14万
  • 项目类别:
    Continuing Grant
計測・通信品質が保証されない環境下の多目的フィードフォワード最適制御と強化学習
测量和通信质量无法保证环境下的多目标前馈最优控制和强化学习
  • 批准号:
    23K20948
  • 财政年份:
    2024
  • 资助金额:
    $ 15.14万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
遅延を考慮した非同期分散型マルチモジュール・タイムスケール深層強化学習の開発
考虑延迟的异步分布式多模块时间尺度深度强化学习的开发
  • 批准号:
    23K21710
  • 财政年份:
    2024
  • 资助金额:
    $ 15.14万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
強化学習を用いた分散制御によるネットワーク信号制御の最適化に関する研究
基于强化学习的分布式控制网络信号控制优化研究
  • 批准号:
    23K26216
  • 财政年份:
    2024
  • 资助金额:
    $ 15.14万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
深層強化学習を用いた運動ノイズの影響を最小化する運動制御推定フレームワークの構築
使用深度强化学习构建运动控制估计框架,最大限度地减少运动噪声的影响
  • 批准号:
    24KJ2223
  • 财政年份:
    2024
  • 资助金额:
    $ 15.14万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
強化学習モデル・ネットワーク分析によるサイコパシーの情報処理メカニズムの解明
利用强化学习模型和网络分析阐明精神病态的信息处理机制
  • 批准号:
    24K16865
  • 财政年份:
    2024
  • 资助金额:
    $ 15.14万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
汎用かつ再利用可能な方策に基づく階層強化学習
基于通用和可重用策略的分层强化学习
  • 批准号:
    23K28140
  • 财政年份:
    2024
  • 资助金额:
    $ 15.14万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
リスクの不確実性に対処する自律分散型マルチエージェント強化学習の研究開発
应对风险不确定性的自主分布式多智能体强化学习研发
  • 批准号:
    24K20873
  • 财政年份:
    2024
  • 资助金额:
    $ 15.14万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了