Basic framework of the asymptotic best-response model with deep-reinforcement learning in the traffic simulation applications
交通仿真应用中深度强化学习渐近最佳响应模型的基本框架
基本信息
- 批准号:20K04719
- 负责人:
- 金额:$ 2.75万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2020
- 资助国家:日本
- 起止时间:2020-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究は、交通システムを利用する個々のユーザーを個別の意思決定者と捉え、特に経路選択行動を対象にゲーム論的なマルチユーザーシステムとしてモデル化し、その日々の選択行動を学習モデルして定式化し、短期政策効果をシミュレーションする手法の確立を目的としている。本研究で提案された手法を漸近的最適応答(ABR)モデルと呼び、確率的・動的に変動するネットワーク分析に有用である。ABRの動的安定性解析は微分包含で表され、再帰的な複数Nash均衡に収束する。ABRはミクロ交通流シミュレーションモデルと併用することにより、シミュレーションベースの動的経路選択モデルとして機能するが、非連続な交通費用関数の場合を含む複雑なコスト関数の場合にも適用可能であり、また、異なる時間価値のマルチユーザーの場合にもNash均衡に収束する点で汎用性がある。このような離散的動的モデルの実用性をさらに高めるために、深層強化学習と組み合わせることにより、追い越し行動などのドライバーのより複雑な挙動をモデル化することが当該年度の課題であった。しかし、シングルユーザーの場合の解析は終了したもののマルチユーザーの場合のシステムの安定性が課題として残された。ABRは、利用者の自己組織的な学習行動に基礎を置くが、交通システムの実際の運用においては道路管理者がユーザーに交通情報を提供することによって何らかの形で介入することも必要になろう。この目的のため、ゲーミフィケーションを用いた道路交通マネージメントの可能性を検討課題とした。すなわち、行動変容には内発的な動機付けのみならず外発的動機付けも必要であるとのアイデアである。ABRとゲーミフィケーションは全く異なるアプローチに思えるが強化学習理論の枠内で統一的なモデル化が可能である。
This study は, traffic シ ス テ ム を using す る a 々 の ユ ー ザ ー を individual の mean と decides to catch え, に 経 road sentaku action を like に seaborne ゲ ー ム theory な マ ル チ ユ ー ザ ー シ ス テ ム と し て モ デ ル し, そ の day 々 の sentaku を action learning モ デ ル し て demean し, short-term policy unseen fruit を シ ミ ュ レ ー シ ョ ン す る gimmick の establish を mesh Youdaoplaceholder0 て て る る. This study proposed で さ れ た gimmick を asymptotic optimal 応 answer (ABR) モ デ ル と shout び, probabilistic, dynamic に - move す る ネ ッ ト ワ ー ク analysis に useful で あ る. The stability of ABR <s:1> motion is analyzed by the <s:1> differential, which includes the で table され and then the な complex Nash equilibrium に bundle する of 帰. ABR は ミ ク ロ traffic flow シ ミ ュ レ ー シ ョ ン モ デ ル と and す る こ と に よ り, シ ミ ュ レ ー シ ョ ン ベ ー ス の moving 経 road sentaku モ デ ル と し て function す る が, not even 続 な transportation masato number を contain む の occasions after 雑 な コ ス ト masato number の occasions に も may apply で あ り, ま た, different な る time 価 numerical の マ ル チ ユ ー ザ ー の occasion Youdaoplaceholder0 Nash equilibrium に bundle する point で versatility がある. こ の よ う な discrete dynamic モ デ ル の be use sex を さ ら に high め る た め に, deep intensive study group と み わ せ る こ と に よ り, chasing the more い し action な ど の ド ラ イ バ ー の よ り complex 雑 な 挙 dynamic を モ デ ル change す る こ と が when the annual の subject で あ っ た. し か し, シ ン グ ル ユ ー ザ ー の occasions の parsing は end し た も の の マ ル チ ユ ー ザ ー の occasions の シ ス テ ム の stability が subject と し て residual さ れ た. ABR は, ik の に な learning action of their organisation を buy く が, traffic シ ス テ ム の be interstate の using に お い て は road managers が ユ ー ザ ー に traffic intelligence を provide す る こ と に よ っ て what ら か の form で intervention す る こ と も necessary に な ろ う. こ の purpose の た め, ゲ ー ミ フ ィ ケ ー シ ョ ン を with い た road traffic マ ネ ー ジ メ ン ト の possibility を 検 for subject と し た. す な わ ち, action - let に は 発 な incentive pay within け の み な ら ず 発 outside incentive pay け も necessary で あ る と の ア イ デ ア で あ る. ABR と ゲ ー ミ フ ィ ケ ー シ ョ ン は く all different な る ア プ ロ ー チ に think え る が reinforcement learning theory の 枠 で unified within な モ デ ル change が may で あ る.
项目成果
期刊论文数量(12)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Investigation of Changes in Passenger Behavior Using Longitudinal Smart Card Data
- DOI:10.1007/s13177-020-00232-3
- 发表时间:2020-10
- 期刊:
- 影响因子:2.1
- 作者:Rattanaporn Kaewkluengklom;F. Kurauchi;Takenori Iwamoto
- 通讯作者:Rattanaporn Kaewkluengklom;F. Kurauchi;Takenori Iwamoto
Social Dynamics Simulation Using a Multi-Layer Network
- DOI:10.3390/su132413744
- 发表时间:2021-12
- 期刊:
- 影响因子:3.9
- 作者:Nao Sugiki;S. Nagao;F. Kurauchi;Mustafa Mutahari;Kojiro Matsuo
- 通讯作者:Nao Sugiki;S. Nagao;F. Kurauchi;Mustafa Mutahari;Kojiro Matsuo
How Does Travel Demand Follow the Change in Infrastructure? Multiple-Year Eigenvector Centrality Analysis
- DOI:10.3390/su132313366
- 发表时间:2021-12
- 期刊:
- 影响因子:3.9
- 作者:Hiroe Ando;F. Kurauchi
- 通讯作者:Hiroe Ando;F. Kurauchi
Estimation of Transfer Time Distribution Parameters with Automatic Fare Collection Data: Stochastic Frontier Model
利用自动售检票数据估计换乘时间分布参数:随机前沿模型
- DOI:10.1061/jtepbs.0000536
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Wahaballa;A.M.;Kurauchi;F.;Schmocker;J.-D. and Iwamoto;T.
- 通讯作者:T.
深層学習による高速道路の渋滞ナウキャストに関する研究
基于深度学习的高速公路拥堵实时预报研究
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:川本 義海;瀧 駿佑;堀江祐希,朝岡良浩,古川仁志;杜然,倉内文孝
- 通讯作者:杜然,倉内文孝
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
宮城 俊彦其他文献
Some Aspects of the Combined Trip Distribution and Assignment Model Derived from the User Equilibrium Concept
从用户均衡概念导出的组合出行分配和指派模型的某些方面
- DOI:
- 发表时间:
1986 - 期刊:
- 影响因子:0
- 作者:
宮城 俊彦;吉田 俊和 - 通讯作者:
吉田 俊和
氷解モデルを基礎とした地域間交易モデルの基本構造:応用一般均衡モデルによるアプローチ
基于融冰模型的区域间贸易模型的基本结构:应用一般均衡模型的方法
- DOI:
- 发表时间:
2003 - 期刊:
- 影响因子:0
- 作者:
Ishikawa;Y.;T.Miyagi;宮城 俊彦 - 通讯作者:
宮城 俊彦
宮城 俊彦的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('宮城 俊彦', 18)}}的其他基金
ネットワーク競争の理論と公共政策への応用に関する研究
网络竞争理论及其在公共政策中的应用研究
- 批准号:
03650433 - 财政年份:1991
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
非集計選択行動理論を基礎としたネットワーク均衡問題とその解法
基于分类选择行为理论的网络均衡问题及其求解
- 批准号:
59750433 - 财政年份:1984
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
交通均衡モデルを基礎とした交通量の区間予測法とその計画概念に関する研究
基于交通平衡模型的交通量预测方法及其规划理念研究
- 批准号:
X00210----575344 - 财政年份:1980
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)














{{item.name}}会员




