環境モデル徒弟学習の抜本的高速化技術の開発と実用的対話システムのプロトタイプ構築

开发技术以显着加快环境模型学徒的学习速度并构建实用对话系统的原型

基本信息

  • 批准号:
    25730128
  • 负责人:
  • 金额:
    $ 2.66万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2013
  • 资助国家:
    日本
  • 起止时间:
    2013-04-01 至 2014-03-31
  • 项目状态:
    已结题

项目摘要

初年度の課題は、環境モデル徒弟学習を抜本的に高速化する技術を開発することであった。環境モデル徒弟学習においては、部分観測マルコフ決定過程の最適解計算を多数回実行する必要があり、計算速度が非常に遅いため、実用的な問題に適用することが不可能であり、高速化が不可欠な問題となっていた。本研究では、2つの手法、すなわち、方策の事後確率の列勾配計算による高速化と前回の解の再利用による高速化技術を開発し、実際に実装することで高速化を実現することができた。本研究で開発した技術は、オープンソースソフトウェア LUKE として一般に公開した。また、人工知能学会全国大会などで発表した。
In the early years, the problem of environmental protection and the development of high-speed technology for students 'learning were discussed. Environmental learning is the most important part of the process of determining the optimal solution. The calculation speed is very high. The application speed is impossible. In this study, we developed a new method to realize the high speed of the system, which is based on the high speed of the system, the high speed of the system, and the high speed of the system. This study is open to the public. The National Congress of the Artificial Intelligence Society was held in Beijing.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
強化学習をベイズで理解する
用贝叶斯方法理解强化学习
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Hiroshi Nakano;Hiroshi Ono;Norio Iwasawa;Toshiyuki Takai;Yumiko Arai-Sanoh;Motohiko Kondo;Takaki Makino;中野洋,小野裕嗣,岩澤紀生,髙井俊之,荒井裕見子,近藤始彦;牧野 貴樹
  • 通讯作者:
    牧野 貴樹
LUKE (Learning Underlying Knowledge of Experts)
LUKE(学习专家的基础知识)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Estimation of POMDP Parameters by Apprenticeship Learning
通过学徒学习估计 POMDP 参数
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Hiroshi Nakano;Hiroshi Ono;Norio Iwasawa;Toshiyuki Takai;Yumiko Arai-Sanoh;Motohiko Kondo;Takaki Makino
  • 通讯作者:
    Takaki Makino
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

牧野 貴樹其他文献

A pulsed neural network for language understanding : Discrete-event simulation of a short-term memory mechanism and sentence understanding
用于语言理解的脉冲神经网络:短期记忆机制和句子理解的离散事件模拟
  • DOI:
  • 发表时间:
    2002
  • 期刊:
  • 影响因子:
    0
  • 作者:
    牧野 貴樹
  • 通讯作者:
    牧野 貴樹
Impact of Computational Theory of Language Understanding for Development of Neural Network Model 牧野 貴樹 MAKINO Takaki † ‡ ( PY ) 合原 一幸 AIHARA Kazuyuki
语言理解计算理论对神经网络模型发展的影响 Takaki Makino MAKINO Takaki † ‡ ( PY ) AIHARA Kazuyuki
  • DOI:
  • 发表时间:
    2002
  • 期刊:
  • 影响因子:
    0
  • 作者:
    牧野 貴樹;M. Takaki;合原 一幸;Aihara Kazuyuki;新領域創成科学研究科 東京大学大学院;複雑理工学専攻
  • 通讯作者:
    複雑理工学専攻

牧野 貴樹的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('牧野 貴樹', 18)}}的其他基金

ニューロンの時間的発火相関モデルを利用した自然言語の意味解析と推論学習
使用时间神经元放电相关模型进行自然语言的语义分析和推理学习
  • 批准号:
    02J07396
  • 财政年份:
    2002
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
コネクショニスト的手法を融合した瞹眛推論/学習モデル
结合联结主义方法的直观推理/学习模型
  • 批准号:
    99J09954
  • 财政年份:
    1999
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似海外基金

昆虫の歩行データ駆動型逆強化学習から探る脚協調制御則の設計論
从昆虫步态数据驱动的逆强化学习探索腿部协调控制律的设计理论
  • 批准号:
    24KJ0341
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
マルチスケール性と安全性を指向する逆強化学習ベース運転行動モデリング
基于逆强化学习的驾驶行为建模,旨在实现多可扩展性和安全性
  • 批准号:
    24K03015
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
人と自律システム系の多目的性に着目した逆強化学習の展開:危険ゼロと快適最大化
逆向强化学习的发展重点关注人类和自主系统的多用途性质:零危险和最大舒适度
  • 批准号:
    23K24921
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Development of Collision Avoidance System for Maritime Autonomous Surface Ship: Imitating and Surpassing Human Experts by Deep Inverse Reinforcement Learning
海上自主水面船舶防撞系统开发:通过深度逆强化学习模仿并超越人类专家
  • 批准号:
    22KJ2623
  • 财政年份:
    2023
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
階層型逆強化学習に基づく多様な状況における運転行動モデリング
基于分层逆强化学习的多种场景驾驶行为建模
  • 批准号:
    23KJ0896
  • 财政年份:
    2023
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Partially Observable Multi-agent Inverse Reinforcement Learning
部分可观察多智能体逆强化学习
  • 批准号:
    2894217
  • 财政年份:
    2023
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Studentship
CIF: Small: Inverse Reinforcement Learning for Cognitive Sensing
CIF:小:认知感知的逆强化学习
  • 批准号:
    2312198
  • 财政年份:
    2023
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Standard Grant
マルチエージェント逆強化学習による動物の集団形成を制御する意思決定機構の解明
利用多智能体逆强化学习阐明控制动物群体形成的决策机制
  • 批准号:
    22K15181
  • 财政年份:
    2022
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Development of inverse reinforcement learning focusing on the multiobjective nature of humans and autonomous systems: towards zero risk and comfort maximization.
逆向强化学习的发展侧重于人类和自主系统的多目标性质:实现零风险和舒适度最大化。
  • 批准号:
    22H03665
  • 财政年份:
    2022
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
安定・安全を指向する逆強化学習に基づく運転行動モデリング
基于逆强化学习的驾驶行为建模,以稳定性和安全性为目标
  • 批准号:
    21H03517
  • 财政年份:
    2021
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了