自動運転のパーソナライゼーションによる乗員の快適性向上

通过自动驾驶的个性化提高乘客舒适度

基本信息

  • 批准号:
    18J13910
  • 负责人:
  • 金额:
    $ 1.22万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2018
  • 资助国家:
    日本
  • 起止时间:
    2018-04-25 至 2020-03-31
  • 项目状态:
    已结题

项目摘要

平成30年度は逆強化学習や自動運転に関する研究の調査,実験環境の整備,逆強化学習に用いる特徴量を抽出法の提案,および逆強化学習の比較や検討をおこなった.研究の調査では,主に国際会議の参加や調査論文の投稿をおこなった.ストックホルムでおこなわれたIJCAI-ECAI 2018のワークショップATT2018において論文の発表をおこない,研究に関する議論を交わした.このワークショップは,メジャーな国際会議であるIJCAIに併設されていることから,非常にレベルの高い研究者が集まっていると考えられる.実際にここでの議論から様々な着想を得ることができた.また,世界各国から集まった研究の調査もでき,調査論文として内容をまとめて投稿した.学会に発表した論文では,自動運転車の強化学習に必要な特徴量を抽出するアルゴリズムを提案した.最近の自動運転技術では,数多くの観測すべき対象物を含む環境入力に対して適切な行動出力が学習できる深層強化学習が注目されている.しかし,入出力関係がブラックボックスとなる深層強化学習を適用することは難しい.そこで提案法では,深層強化学習後のネットワークを解析することにより,学習後の自動運転方策に必要となる特徴量を抽出する.基本的なアイデアは,入力に対する出力の勾配を求めることである.勾配の値が大きいほど,出力に与える影響も大きくなると考えられるため,勾配が大きくなる特徴量が重要となる.計算機実験では,自動運転タスクのベンチマーク問題であるTORCSを用いて,提案手法の有効性を確かめた.平成30年度の後半では,LogRegIRLやNNP-FIRLなどの逆強化学習アルゴリズムを比較し,検討していた.今後はこの検討結果をもとに研究を続ける.
Research on inverse reinforcement learning and automatic operation in 2007 - 2008, preparation of environment, proposal of feature extraction method for inverse reinforcement learning, comparison and discussion of inverse reinforcement learning. Research and participation in international conferences and contribution of research papers. IJCAI-ECAI 2018 will be the first to discuss the issue of ATT2018. The IJCAI is an international conference, and it is a very important event for researchers to gather together. In the meantime, the discussion of the matter is going on. Research papers collected from various countries in the world are submitted for research. In this paper, we propose a new method to extract the necessary features for reinforcement learning of automatic transport vehicles. Recently, automatic operation technology has attracted a lot of attention, such as deep reinforcement learning, which includes environmental input, appropriate action input and so on. Deep reinforcement learning is applicable to the relationship between input and output. The proposed method is to extract the necessary features for automatic operation after deep reinforcement learning. The basic idea is to ask for the matching of input and output. The matching value is high, the output is high, the influence is high, the matching characteristic is high. The computer automatically runs the program to solve the problem of TORCS, and the proposal method is effective. In the second half of 2010, LogRegIRL and NNP-FIRL were compared and discussed. In the future, we will discuss the results.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Reinforcement Learning Meets Challenge for Human Intelligent Mobility
强化学习迎接人类智能移动的挑战
Learning Cooperative Policy among Self-Driving Vehicles for Relieving Traffic Jams
学习自动驾驶汽车缓解交通拥堵的合作策略
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Shota Ishikawa;Sachiyo Arai
  • 通讯作者:
    Sachiyo Arai
Learning Cooperative Policy among Self-Driving Vehicles for Reducing Traffic Jams
学习自动驾驶车辆之间的合作政策以减少交通拥堵
市街地の自動運転における環境情報のフィルタリング
城市自动驾驶中环境信息的过滤
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Zehua Yang;Yusuke Yamamoto;Takehiro Yamamoto;Noriko Kando;Hiroaki Ohshima;北村清也,石川翔太,荒井幸代
  • 通讯作者:
    北村清也,石川翔太,荒井幸代
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

石川 翔太其他文献

大気圧マイクロ波プラズマCVDによるSiO2膜形成及び膜評価
常压微波等离子体CVD法SiO2成膜及膜评价
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    石川 翔太;鈴木 陽香;豊田 浩孝
  • 通讯作者:
    豊田 浩孝
静電容量式センサーによる空洞評価の模型実験
使用电容传感器进行空腔评估的模型实验
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    石川 翔太;上野 勝利ほか
  • 通讯作者:
    上野 勝利ほか
先行車情報の共有が自然渋滞に与える影響の解析:Nagel-Schreckenberg Modelの一般化
共享前车信息对自然拥堵的影响分析:Nagel-Schreckenberg 模型的推广
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    石川 翔太;荒井 幸代
  • 通讯作者:
    荒井 幸代

石川 翔太的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

昆虫の歩行データ駆動型逆強化学習から探る脚協調制御則の設計論
从昆虫步态数据驱动的逆强化学习探索腿部协调控制律的设计理论
  • 批准号:
    24KJ0341
  • 财政年份:
    2024
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
マルチスケール性と安全性を指向する逆強化学習ベース運転行動モデリング
基于逆强化学习的驾驶行为建模,旨在实现多可扩展性和安全性
  • 批准号:
    24K03015
  • 财政年份:
    2024
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
人と自律システム系の多目的性に着目した逆強化学習の展開:危険ゼロと快適最大化
逆向强化学习的发展重点关注人类和自主系统的多用途性质:零危险和最大舒适度
  • 批准号:
    23K24921
  • 财政年份:
    2024
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Development of Collision Avoidance System for Maritime Autonomous Surface Ship: Imitating and Surpassing Human Experts by Deep Inverse Reinforcement Learning
海上自主水面船舶防撞系统开发:通过深度逆强化学习模仿并超越人类专家
  • 批准号:
    22KJ2623
  • 财政年份:
    2023
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
階層型逆強化学習に基づく多様な状況における運転行動モデリング
基于分层逆强化学习的多种场景驾驶行为建模
  • 批准号:
    23KJ0896
  • 财政年份:
    2023
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Partially Observable Multi-agent Inverse Reinforcement Learning
部分可观察多智能体逆强化学习
  • 批准号:
    2894217
  • 财政年份:
    2023
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Studentship
CIF: Small: Inverse Reinforcement Learning for Cognitive Sensing
CIF:小:认知感知的逆强化学习
  • 批准号:
    2312198
  • 财政年份:
    2023
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Standard Grant
マルチエージェント逆強化学習による動物の集団形成を制御する意思決定機構の解明
利用多智能体逆强化学习阐明控制动物群体形成的决策机制
  • 批准号:
    22K15181
  • 财政年份:
    2022
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Development of inverse reinforcement learning focusing on the multiobjective nature of humans and autonomous systems: towards zero risk and comfort maximization.
逆向强化学习的发展侧重于人类和自主系统的多目标性质:实现零风险和舒适度最大化。
  • 批准号:
    22H03665
  • 财政年份:
    2022
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
安定・安全を指向する逆強化学習に基づく運転行動モデリング
基于逆强化学习的驾驶行为建模,以稳定性和安全性为目标
  • 批准号:
    21H03517
  • 财政年份:
    2021
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了