登录/注册

调研领500喵币

扫一扫下载APP

下载APP

开通猫会员

用户头像

{{ userInfo.nickname }}

个人中心

ID: {{ userInfo.uid }}

复制

会员有效期至{{dayjs(userInfo?.membership_time * 1000).format('YYYY.MM.DD')}}

开通会员尊享 16+ 权益

{{isVip ? '立即续费' : '立即开通'}}

5分钟定题

5分钟定题

课程8折

3步出标书

文献分析

文献分析

更多特权

更多特权

剩余喵币

{{userInfo.mew_coin_count}}

{{userInfo.over_mew_coin || 0}}喵币将在本周失效

专属邀请码

复制

{{userInfo.share?.code}}

邀好友注册得200喵币/人任务中心

任务中心

退出账号

{{loginType === 2 ? '微信扫码注册' : '欢迎来到猫眼课题宝'}}

登录二维码

刷新登录二维码

刷新

登录即代表您同意并遵守《隐私协议》

为了保证账户安全，请在
微信「猫眼课题宝」内点击授权

重新扫码

刷新登录二维码

刷新

登录即代表您同意并遵守《隐私协议》

账号注册

您好~为了给您提供更精准的分析体验，需完善基础信息！所有信息100%保密，请放心填写！

立即使用

切换微信登录

*注：建议或bug反馈被采纳后获得{{feedback_mew_coin}}喵币奖励，请关注公众号模版消息通知

取消

提交

已收到您的反馈，我们会尽快处理。若内容被采纳你将获得{{feedback_mew_coin}}喵币奖励。请关注《猫眼课题宝》消息通知。

{{ChannelMewCoin}}

喵币已到账！

*喵币用于产品体验解锁使用，有效期 30 天

在猫眼课题宝您可以：

{{item.title}}

{{item.desc}}

微信扫码添加小助理，回复“调研”
领取调研问卷

首次添加还可额外获得
{{customer_mew_coin}}喵币奖励哦！

完成问卷填写，立得{{question_mew_coin}}喵币奖励

永久回看权已生效！

直播主题

《{{latestCourse?.name}}》

立即去查看

7天猫会员

有效期至：{{dayjs(userInfo.membership_time * 1000).format('YYYY-MM-DD HH:mm')}}

已送您“7天会员体验卡+500喵币”

次数升级

享3步出标书等多功能月解锁次数1次

10次

优享折扣

获会员期内充值喵币 8折等3大折扣

开心收下

永久回看权已生效！

课程

《{{giftRes?.img}}》

立即去查看

永久回看权已生效！

课程

《{{receiveTrainingCourseInfo?.name}}》

立即去查看

{{userInfo?.nickname}}

猫会员

{{vipStr}}

后失效

·查看权益对比·

猫会员

（全方位提升课题决策能力）

会员专属

升级猫会员：购买喵币享 8 折优惠

免费领最高 6W 喵币

二维码

{{qrCodeError}}

请先阅读
服务协议并同意

扫码添加「专属客服」
了解团购优惠方案

客服在线时间：工作日9:00-18:00

￥

{{currentInfo?.price}}

已优惠{{ _.floor(_.toNumber(currentInfo.original_price) - _.toNumber(currentInfo.price), 0) }}元

倒计时

支持：

支付宝

支付宝/

微信

*信息服务类购买后不支持退款

请阅读并同意《猫眼课题宝服务协议》

常见问题

会员权益说明

会员权益对比

权益分类	功能权益	普通用户	{{item.name}}会员
{{category.name}}	{{benefitItem.name}}

- 微信扫一扫 -

请添加您的「专属会员管家」
提供专属会员服务

Theory of Reinforcement Learning and Algorithms of Route Choice in Transportation Networks

交通网络中的强化学习理论与路径选择算法

基本信息

批准号：
22360201
负责人：
MIYAGI Toshihiko
金额：
$ 5.24万
依托单位：
Tohoku University
依托单位国家：
日本
项目类别：
Grant-in-Aid for Scientific Research (B)
财政年份：
2010
资助国家：
日本
起止时间：
2010 至 2012
项目状态：
已结题

项目摘要

This research shows that an individual traveler in transportation networks is rigorously modeled as an adaptive learning agent who receives travel information through day-to-day experience and makes his decision so as to reinforce his action depending the realized payoffs. An adaptive learning algorithm consistent with the theory is proposed and proved that it leads the system to a Nash equilibrium with probability one. The proposed algorithms have tested numerically by using example networks with various ill-defined link cost functions and examined a rapid convergence of the algorithms. In addition, we have proposed an estimation method for the structure parameters included in the route choice model. The application to the data of theday-to-day route choice obtained by the indoor experiments was satisfactory.

该研究表明，在交通网络中的个人旅行者被严格建模为自适应学习代理人谁接收的旅行信息，通过日常的日常经验，使他的决定，以加强他的行动依赖于实现的回报。提出了一种与理论相一致的自适应学习算法，并证明了该算法使系统以概率1到达纳什均衡。所提出的算法进行了数值测试，使用的例子网络与各种定义不明确的链路成本函数，并检查算法的快速收敛。此外，我们还提出了一种估计方法的结构参数中包含的路径选择模型。应用于室内实验获得的日常路径选择数据，效果令人满意。

项目成果

期刊论文数量（0）

专著数量（0）

科研奖励数量（0）

会议论文数量（0）

专利数量（0）

nformed-user algorithms that converges to Nash equilibrium in traffic games

流量博弈中收敛到纳什均衡的知情用户算法

DOI：
发表时间：
期刊：
影响因子：
0
作者：
Regmi;R.K.;Nakagawa;H.;Kawaike;K.;Baba;Y.;Zhang;H.;重谷祐樹;G.C. Peque,Jr.
通讯作者：
G.C. Peque,Jr.

カルマンフィルターを応用した所要時間推定法の提案実用性

提出了应用卡尔曼滤波器所需时间估计方法的实用性

DOI：
发表时间：
2010
期刊：
影响因子：
0
作者：
Zhang H.;Nakagawa;H. and Mizutani;H;村上大輔・堤盛人;Mohammad Farid;高橋雅憲,高山純一,中山晶一朗;渡部桂子;宮田輝星・宮城俊彦
通讯作者：
宮田輝星・宮城俊彦

経路選択行動に関する室内実験

路径选择行为的实验室实验

DOI：
发表时间：
2013
期刊：
交通工学
影响因子：
0
作者：
Ryosuke Arai;So Kazama;Sinji Takahashi and Yasuhiro Takemon;A. Matsumoto;池田愛,宮城俊彦
通讯作者：
池田愛,宮城俊彦

社会資本整備を内包した経済成長モデルのパラメータ推定

包括社会资本发展的经济增长模型参数估计

DOI：
发表时间：
2010
期刊：
土木計画学研究・論文集
影响因子：
0
作者：
Toru Hagiwara;Hidekatsu Hamaoka;加藤裕人・宮城俊彦・仲原由布子
通讯作者：
加藤裕人・宮城俊彦・仲原由布子

Informed-user algorithms that converges to Nash equilibrium in traffic games

在流量博弈中收敛到纳什均衡的知情用户算法

DOI：
发表时间：
2012
期刊：
Procedia-Social and Behavioral Sciences
影响因子：
0
作者：
Miyagi;T.;and G.C. Peque,Jr.
通讯作者：
and G.C. Peque,Jr.

{{ item.title }}

{{ item.translation_title }}

DOI：
{{ item.doi }}
发表时间：
{{ item.publish_year }}
期刊：
{{ item.journal_name }}
影响因子：
{{ item.factor }}
作者：
{{ item.authors }}
通讯作者：
{{ item.author }}

数据更新时间：{{ journalArticles.updateTime }}

{{ item.title }}

作者：
{{ item.author }}

数据更新时间：{{ monograph.updateTime }}

{{ item.title }}

作者：
{{ item.author }}

数据更新时间：{{ sciAawards.updateTime }}

{{ item.title }}

作者：
{{ item.author }}

数据更新时间：{{ conferencePapers.updateTime }}

{{ item.title }}

作者：
{{ item.author }}

数据更新时间：{{ patent.updateTime }}

MIYAGI Toshihiko其他文献

MIYAGI Toshihiko的其他文献

{{ item.title }}

{{ item.translation_title }}

DOI：
{{ item.doi }}
发表时间：
{{ item.publish_year }}
期刊：
{{ item.journal_name }}
影响因子：
{{ item.factor }}
作者：
{{ item.authors }}
通讯作者：
{{ item.author }}

{{ truncateString('MIYAGI Toshihiko', 18)}}的其他基金

A Study on Dynamic Traffic Assignment Based on An Atomic Model of Route-Choice

基于路由选择原子模型的动态交通分配研究

批准号：
26420511
财政年份：
2014
资助金额：
$ 5.24万
项目类别：
Grant-in-Aid for Scientific Research (C)

The Study on Development and Applicability of Knowledge-Based Learning Algorithm for Route Guidance

基于知识学习的路径引导算法开发及适用性研究

批准号：
18560519
财政年份：
2006
资助金额：
$ 5.24万
项目类别：
Grant-in-Aid for Scientific Research (C)

Non-surveying Construction of a 47 Interregional Input-Output Table and Calibration of SCGE Model

47个区域间投入产出表的非调查构建及SCGE模型的校正

批准号：
15560458
财政年份：
2003
资助金额：
$ 5.24万
项目类别：
Grant-in-Aid for Scientific Research (C)

Sensitivity Analysis for Multiregional General Equilibrium Models

多区域一般均衡模型的敏感性分析

批准号：
13650582
财政年份：
2001
资助金额：
$ 5.24万
项目类别：
Grant-in-Aid for Scientific Research (C)

Integration of Transportation Planning Process Combining with Demand Forecasting Process

交通规划流程与需求预测流程的集成

批准号：
11650545
财政年份：
1999
资助金额：
$ 5.24万
项目类别：
Grant-in-Aid for Scientific Research (C)

A STUDY ON APPLIED NETWORK EQUILIBRIUM MODELS

应用网络均衡模型的研究

批准号：
07650618
财政年份：
1995
资助金额：
$ 5.24万
项目类别：
Grant-in-Aid for Scientific Research (C)

A formulation of spatial price equilibrium model and its computation procedure

空间价格均衡模型的建立及其计算过程

批准号：
63550387
财政年份：
1988
资助金额：
$ 5.24万
项目类别：
Grant-in-Aid for General Scientific Research (C)

相似海外基金

Collaborative Research: CDS&E: Generalizable RANS Turbulence Models through Scientific Multi-Agent Reinforcement Learning

合作研究：CDS

批准号：
2347423
财政年份：
2024
资助金额：
$ 5.24万
项目类别：
Standard Grant

深層強化学習を用いた運動ノイズの影響を最小化する運動制御推定フレームワークの構築

使用深度强化学习构建运动控制估计框架，最大限度地减少运动噪声的影响

批准号：
24KJ2223
财政年份：
2024
资助金额：
$ 5.24万
项目类别：
Grant-in-Aid for JSPS Fellows

CAREER: Stochasticity and Resilience in Reinforcement Learning: From Single to Multiple Agents

职业：强化学习中的随机性和弹性：从单个智能体到多个智能体

批准号：
2339794
财政年份：
2024
资助金额：
$ 5.24万
项目类别：
Continuing Grant

Learning to Reason in Reinforcement Learning

在强化学习中学习推理

批准号：
DP240103278
财政年份：
2024
资助金额：
$ 5.24万
项目类别：
Discovery Projects

強化学習モデル・ネットワーク分析によるサイコパシーの情報処理メカニズムの解明

利用强化学习模型和网络分析阐明精神病态的信息处理机制

批准号：
24K16865
财政年份：
2024
资助金额：
$ 5.24万
项目类别：
Grant-in-Aid for Early-Career Scientists

リスクの不確実性に対処する自律分散型マルチエージェント強化学習の研究開発

应对风险不确定性的自主分布式多智能体强化学习研发

批准号：
24K20873
财政年份：
2024
资助金额：
$ 5.24万
项目类别：
Grant-in-Aid for Early-Career Scientists

計測・通信品質が保証されない環境下の多目的フィードフォワード最適制御と強化学習

测量和通信质量无法保证环境下的多目标前馈最优控制和强化学习

批准号：
23K20948
财政年份：
2024
资助金额：
$ 5.24万
项目类别：
Grant-in-Aid for Scientific Research (B)

遅延を考慮した非同期分散型マルチモジュール・タイムスケール深層強化学習の開発

考虑延迟的异步分布式多模块时间尺度深度强化学习的开发

批准号：
23K21710
财政年份：
2024
资助金额：
$ 5.24万
项目类别：
Grant-in-Aid for Scientific Research (B)

汎用かつ再利用可能な方策に基づく階層強化学習

基于通用和可重用策略的分层强化学习

批准号：
23K28140
财政年份：
2024
资助金额：
$ 5.24万
项目类别：
Grant-in-Aid for Scientific Research (B)

強化学習を用いた分散制御によるネットワーク信号制御の最適化に関する研究

基于强化学习的分布式控制网络信号控制优化研究

批准号：
23K26216
财政年份：
2024
资助金额：
$ 5.24万
项目类别：
Grant-in-Aid for Scientific Research (B)

{{ showInfoDetail.title }}

成果类型：
{{ showInfoTypeEnum[showInfoType] }}

学术检索：
百度学术

作者：{{ showInfoDetail.author }}

知道了