Basic framework of the asymptotic best-response model with deep-reinforcement learning in the traffic simulation applications
交通仿真应用中深度强化学习渐近最佳响应模型的基本框架
基本信息
- 批准号:20K04719
- 负责人:
- 金额:$ 2.75万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2020
- 资助国家:日本
- 起止时间:2020-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究は、交通システムを利用する個々のユーザーを個別の意思決定者と捉え、特に経路選択行動を対象にゲーム論的なマルチユーザーシステムとしてモデル化し、その日々の選択行動を学習モデルして定式化し、短期政策効果をシミュレーションする手法の確立を目的としている。本研究で提案された手法を漸近的最適応答(ABR)モデルと呼び、確率的・動的に変動するネットワーク分析に有用である。ABRの動的安定性解析は微分包含で表され、再帰的な複数Nash均衡に収束する。ABRはミクロ交通流シミュレーションモデルと併用することにより、シミュレーションベースの動的経路選択モデルとして機能するが、非連続な交通費用関数の場合を含む複雑なコスト関数の場合にも適用可能であり、また、異なる時間価値のマルチユーザーの場合にもNash均衡に収束する点で汎用性がある。このような離散的動的モデルの実用性をさらに高めるために、深層強化学習と組み合わせることにより、追い越し行動などのドライバーのより複雑な挙動をモデル化することが当該年度の課題であった。しかし、シングルユーザーの場合の解析は終了したもののマルチユーザーの場合のシステムの安定性が課題として残された。ABRは、利用者の自己組織的な学習行動に基礎を置くが、交通システムの実際の運用においては道路管理者がユーザーに交通情報を提供することによって何らかの形で介入することも必要になろう。この目的のため、ゲーミフィケーションを用いた道路交通マネージメントの可能性を検討課題とした。すなわち、行動変容には内発的な動機付けのみならず外発的動機付けも必要であるとのアイデアである。ABRとゲーミフィケーションは全く異なるアプローチに思えるが強化学習理論の枠内で統一的なモデル化が可能である。
This study aims to establish a method for the rational decision makers to understand and select traffic patterns and short-term policy outcomes. This study proposes an approach to asymptotic optimal response (ABR) analysis of dynamic response. The analytical derivative of ABR dynamic stability consists of complex Nash equilibrium equations. ABR traffic flow control system is applicable to all traffic flow control systems, including the case of complex traffic flow control system, time control system and Nash equilibrium system. This year's topic is about the usefulness of discrete learning, deep reinforcement learning, and integration. The stability of the system is a problem. ABR, users of their own organization of learning actions, the implementation of the road management system to provide traffic information, how to form the necessary information The purpose of this paper is to discuss the possibility of road traffic. All actions and actions are necessary for internal and external motivation. ABR is a unified approach to reinforcement learning theory.
项目成果
期刊论文数量(12)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Investigation of Changes in Passenger Behavior Using Longitudinal Smart Card Data
- DOI:10.1007/s13177-020-00232-3
- 发表时间:2020-10
- 期刊:
- 影响因子:2.1
- 作者:Rattanaporn Kaewkluengklom;F. Kurauchi;Takenori Iwamoto
- 通讯作者:Rattanaporn Kaewkluengklom;F. Kurauchi;Takenori Iwamoto
Social Dynamics Simulation Using a Multi-Layer Network
- DOI:10.3390/su132413744
- 发表时间:2021-12
- 期刊:
- 影响因子:3.9
- 作者:Nao Sugiki;S. Nagao;F. Kurauchi;Mustafa Mutahari;Kojiro Matsuo
- 通讯作者:Nao Sugiki;S. Nagao;F. Kurauchi;Mustafa Mutahari;Kojiro Matsuo
How Does Travel Demand Follow the Change in Infrastructure? Multiple-Year Eigenvector Centrality Analysis
- DOI:10.3390/su132313366
- 发表时间:2021-12
- 期刊:
- 影响因子:3.9
- 作者:Hiroe Ando;F. Kurauchi
- 通讯作者:Hiroe Ando;F. Kurauchi
Estimation of Transfer Time Distribution Parameters with Automatic Fare Collection Data: Stochastic Frontier Model
利用自动售检票数据估计换乘时间分布参数:随机前沿模型
- DOI:10.1061/jtepbs.0000536
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Wahaballa;A.M.;Kurauchi;F.;Schmocker;J.-D. and Iwamoto;T.
- 通讯作者:T.
深層学習による高速道路の渋滞ナウキャストに関する研究
基于深度学习的高速公路拥堵实时预报研究
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:川本 義海;瀧 駿佑;堀江祐希,朝岡良浩,古川仁志;杜然,倉内文孝
- 通讯作者:杜然,倉内文孝
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
宮城 俊彦其他文献
Some Aspects of the Combined Trip Distribution and Assignment Model Derived from the User Equilibrium Concept
从用户均衡概念导出的组合出行分配和指派模型的某些方面
- DOI:
- 发表时间:
1986 - 期刊:
- 影响因子:0
- 作者:
宮城 俊彦;吉田 俊和 - 通讯作者:
吉田 俊和
氷解モデルを基礎とした地域間交易モデルの基本構造:応用一般均衡モデルによるアプローチ
基于融冰模型的区域间贸易模型的基本结构:应用一般均衡模型的方法
- DOI:
- 发表时间:
2003 - 期刊:
- 影响因子:0
- 作者:
Ishikawa;Y.;T.Miyagi;宮城 俊彦 - 通讯作者:
宮城 俊彦
宮城 俊彦的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('宮城 俊彦', 18)}}的其他基金
ネットワーク競争の理論と公共政策への応用に関する研究
网络竞争理论及其在公共政策中的应用研究
- 批准号:
03650433 - 财政年份:1991
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
非集計選択行動理論を基礎としたネットワーク均衡問題とその解法
基于分类选择行为理论的网络均衡问题及其求解
- 批准号:
59750433 - 财政年份:1984
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
交通均衡モデルを基礎とした交通量の区間予測法とその計画概念に関する研究
基于交通平衡模型的交通量预测方法及其规划理念研究
- 批准号:
X00210----575344 - 财政年份:1980
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)














{{item.name}}会员




