Theory of Reinforcement Learning and Algorithms of Route Choice in Transportation Networks
交通网络中的强化学习理论与路径选择算法
基本信息
- 批准号:22360201
- 负责人:
- 金额:$ 5.24万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (B)
- 财政年份:2010
- 资助国家:日本
- 起止时间:2010 至 2012
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This research shows that an individual traveler in transportation networks is rigorously modeled as an adaptive learning agent who receives travel information through day-to-day experience and makes his decision so as to reinforce his action depending the realized payoffs. An adaptive learning algorithm consistent with the theory is proposed and proved that it leads the system to a Nash equilibrium with probability one. The proposed algorithms have tested numerically by using example networks with various ill-defined link cost functions and examined a rapid convergence of the algorithms. In addition, we have proposed an estimation method for the structure parameters included in the route choice model. The application to the data of theday-to-day route choice obtained by the indoor experiments was satisfactory.
该研究表明,在交通网络中的个人旅行者被严格建模为自适应学习代理人谁接收的旅行信息,通过日常的日常经验,使他的决定,以加强他的行动依赖于实现的回报。提出了一种与理论相一致的自适应学习算法,并证明了该算法使系统以概率1到达纳什均衡。所提出的算法进行了数值测试,使用的例子网络与各种定义不明确的链路成本函数,并检查算法的快速收敛。此外,我们还提出了一种估计方法的结构参数中包含的路径选择模型。应用于室内实验获得的日常路径选择数据,效果令人满意。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
nformed-user algorithms that converges to Nash equilibrium in traffic games
流量博弈中收敛到纳什均衡的知情用户算法
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:Regmi;R.K.;Nakagawa;H.;Kawaike;K.;Baba;Y.;Zhang;H.;重谷祐樹;G.C. Peque,Jr.
- 通讯作者:G.C. Peque,Jr.
カルマンフィルターを応用した所要時間推定法の提案実用性
提出了应用卡尔曼滤波器所需时间估计方法的实用性
- DOI:
- 发表时间:2010
- 期刊:
- 影响因子:0
- 作者:Zhang H.;Nakagawa;H. and Mizutani;H;村上大輔・堤盛人;Mohammad Farid;高橋雅憲,高山純一,中山晶一朗;渡部桂子;宮田輝星・宮城俊彦
- 通讯作者:宮田輝星・宮城俊彦
経路選択行動に関する室内実験
路径选择行为的实验室实验
- DOI:
- 发表时间:2013
- 期刊:
- 影响因子:0
- 作者:Ryosuke Arai;So Kazama;Sinji Takahashi and Yasuhiro Takemon;A. Matsumoto;池田愛,宮城俊彦
- 通讯作者:池田愛,宮城俊彦
社会資本整備を内包した経済成長モデルのパラメータ推定
包括社会资本发展的经济增长模型参数估计
- DOI:
- 发表时间:2010
- 期刊:
- 影响因子:0
- 作者:Toru Hagiwara;Hidekatsu Hamaoka;加藤裕人・宮城俊彦・仲原由布子
- 通讯作者:加藤裕人・宮城俊彦・仲原由布子
Informed-user algorithms that converges to Nash equilibrium in traffic games
在流量博弈中收敛到纳什均衡的知情用户算法
- DOI:
- 发表时间:2012
- 期刊:
- 影响因子:0
- 作者:Miyagi;T.;and G.C. Peque,Jr.
- 通讯作者:and G.C. Peque,Jr.
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
MIYAGI Toshihiko其他文献
MIYAGI Toshihiko的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('MIYAGI Toshihiko', 18)}}的其他基金
A Study on Dynamic Traffic Assignment Based on An Atomic Model of Route-Choice
基于路由选择原子模型的动态交通分配研究
- 批准号:
26420511 - 财政年份:2014
- 资助金额:
$ 5.24万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
The Study on Development and Applicability of Knowledge-Based Learning Algorithm for Route Guidance
基于知识学习的路径引导算法开发及适用性研究
- 批准号:
18560519 - 财政年份:2006
- 资助金额:
$ 5.24万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Non-surveying Construction of a 47 Interregional Input-Output Table and Calibration of SCGE Model
47个区域间投入产出表的非调查构建及SCGE模型的校正
- 批准号:
15560458 - 财政年份:2003
- 资助金额:
$ 5.24万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Sensitivity Analysis for Multiregional General Equilibrium Models
多区域一般均衡模型的敏感性分析
- 批准号:
13650582 - 财政年份:2001
- 资助金额:
$ 5.24万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Integration of Transportation Planning Process Combining with Demand Forecasting Process
交通规划流程与需求预测流程的集成
- 批准号:
11650545 - 财政年份:1999
- 资助金额:
$ 5.24万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
A STUDY ON APPLIED NETWORK EQUILIBRIUM MODELS
应用网络均衡模型的研究
- 批准号:
07650618 - 财政年份:1995
- 资助金额:
$ 5.24万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
A formulation of spatial price equilibrium model and its computation procedure
空间价格均衡模型的建立及其计算过程
- 批准号:
63550387 - 财政年份:1988
- 资助金额:
$ 5.24万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
相似海外基金
Collaborative Research: CDS&E: Generalizable RANS Turbulence Models through Scientific Multi-Agent Reinforcement Learning
合作研究:CDS
- 批准号:
2347423 - 财政年份:2024
- 资助金额:
$ 5.24万 - 项目类别:
Standard Grant
深層強化学習を用いた運動ノイズの影響を最小化する運動制御推定フレームワークの構築
使用深度强化学习构建运动控制估计框架,最大限度地减少运动噪声的影响
- 批准号:
24KJ2223 - 财政年份:2024
- 资助金额:
$ 5.24万 - 项目类别:
Grant-in-Aid for JSPS Fellows
CAREER: Stochasticity and Resilience in Reinforcement Learning: From Single to Multiple Agents
职业:强化学习中的随机性和弹性:从单个智能体到多个智能体
- 批准号:
2339794 - 财政年份:2024
- 资助金额:
$ 5.24万 - 项目类别:
Continuing Grant
Learning to Reason in Reinforcement Learning
在强化学习中学习推理
- 批准号:
DP240103278 - 财政年份:2024
- 资助金额:
$ 5.24万 - 项目类别:
Discovery Projects
強化学習モデル・ネットワーク分析によるサイコパシーの情報処理メカニズムの解明
利用强化学习模型和网络分析阐明精神病态的信息处理机制
- 批准号:
24K16865 - 财政年份:2024
- 资助金额:
$ 5.24万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
リスクの不確実性に対処する自律分散型マルチエージェント強化学習の研究開発
应对风险不确定性的自主分布式多智能体强化学习研发
- 批准号:
24K20873 - 财政年份:2024
- 资助金额:
$ 5.24万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
計測・通信品質が保証されない環境下の多目的フィードフォワード最適制御と強化学習
测量和通信质量无法保证环境下的多目标前馈最优控制和强化学习
- 批准号:
23K20948 - 财政年份:2024
- 资助金额:
$ 5.24万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
遅延を考慮した非同期分散型マルチモジュール・タイムスケール深層強化学習の開発
考虑延迟的异步分布式多模块时间尺度深度强化学习的开发
- 批准号:
23K21710 - 财政年份:2024
- 资助金额:
$ 5.24万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
汎用かつ再利用可能な方策に基づく階層強化学習
基于通用和可重用策略的分层强化学习
- 批准号:
23K28140 - 财政年份:2024
- 资助金额:
$ 5.24万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
強化学習を用いた分散制御によるネットワーク信号制御の最適化に関する研究
基于强化学习的分布式控制网络信号控制优化研究
- 批准号:
23K26216 - 财政年份:2024
- 资助金额:
$ 5.24万 - 项目类别:
Grant-in-Aid for Scientific Research (B)














{{item.name}}会员




