実環境ロボット学習における背景知識供与戦略および学習環境の制御戦略に関する研究

真实环境机器人学习中背景知识提供策略与学习环境控制策略研究

基本信息

  • 批准号:
    12750204
  • 负责人:
  • 金额:
    $ 1.41万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    2000
  • 资助国家:
    日本
  • 起止时间:
    2000 至 2001
  • 项目状态:
    已结题

项目摘要

本研究の最終年度である本年度は、主に2つの具体的なタスクを対象として取り上げ、ロボットの学習戦略に関する本研究の提案手法を適用した。その2つのタスクとは、・環境報酬に基づく反射的ルール獲得・定性的な観測情報に基づく環境地図の学習である。まず、前者については、従来ロボット学習の分野では別個に扱われてきた帰納的概念学習法と強化学習法とを統合する方法を情報理論的な立場から提案した。この成果は別掲のように雑誌論文で発表済みである。また、後者については、従来ロボット設計者が暗黙のうちにプログラムに埋め込んでいた環境に関する定性的知識をロボット自身が処理し、環境地図を学習する新しい手法を提案した。この成果も国際学会等で発表され、また雑誌論文に投稿中である。以上のように、本研究で得られた成果はロボット学習分野において非常に新規性・意義に富んだものであり、本課題が終了した後もさらに発展的なテーマに取り組んで行く予定である。
今年,本研究的最后一年主要集中在两个特定任务上,并将本研究的拟议方法应用于机器人学习策略。这两个任务是: - 基于定性观察信息基于环境奖励和学习环境图的反身规则。首先,关于前者,我们提出了一种整合归纳概念学习方法和强化学习方法的方法,从信息理论的角度来看,这些方法传统上在机器人学习领域进行了分开处理。这些结果已经在单独列出的期刊论文中发表。此外,关于后者,我们提出了一种新方法,其中机器人本身处理了关于环境的定性知识,该环境以前被机器人设计师隐含地嵌入了该程序,并学习了环境图。这些结果也已在国际学术会议上提出,目前已提交期刊论文。如上所述,从这项研究中获得的结果在机器人学习领域非常新颖且有意义,我们计划在完成这项任务后继续致力于更高级的主题。

项目成果

期刊论文数量(14)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
矢入健久, 堀浩一, 中須賀真一: "複数行動結果を考慮した最尤推定に基づく状態一般化法"人工知能学会誌. 16・1. 128-138 (2001)
Takehisa Yairi、Koichi Hori、Shinichi Nakasuka:“基于考虑多个动作结果的最大似然估计的状态概括方法”人工智能学会杂志 16・1(2001)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
矢入健久, 堀浩一: "強化学習エージェントの状態空間構成問題への情報理論的アプローチ"第4回情報論的学習理論ワークショップ. 315-320 (2001)
Takehisa Yairi、Koichi Hori:“强化学习代理状态空间构建问题的信息理论方法”,第四届信息理论学习理论研讨会 315-320 (2001)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Takehisa Yairi,Koichi Hori and Shinichi Nakasuka: "Dynamic Reconstruction of State Space for Behavior Acquisition or Reactive Agent"The 6th International Conference on Intelligent Autonomous Systems. 549-554 (2000)
Takehisa Yairi、Koichi Hori 和 Shinichi Nakasuka:“行为获取或反应代理的状态空间动态重建”第六届智能自治系统国际会议。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
矢入健久,堀浩一,中須賀真一: "複数行動結果を考慮した最尤推定に基づく状態一般化法"人工知能学会誌. 16・1. 130-140 (2001)
Takehisa Yairi、Koichi Hori、Shinichi Nakasuka:“基于考虑多个动作结果的最大似然估计的状态概括方法”日本人工智能学会杂志 16・1(2001)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Takehisa Yairi,Koichi Hori and Shinichi Nakasuka: "Autonomous Reconstruction of State Space for Learning of Robot Behavior"IEEE/RSJ International Conference on Intelligent Robots and Systems. 891-896 (2000)
Takehisa Yairi、Koichi Hori 和 Shinichi Nakasuka:“机器人行为学习的状态空间自主重建”IEEE/RSJ 国际智能机器人与系统会议。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

矢入 健久其他文献

画像列を用いた小惑星形状・探査機相対運動の逐次推定
使用图像序列顺序估计小行星形状和航天器相对运动
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鈴木 透馬;矢入 健久;武石 直也;津田 雄一;尾川 順子
  • 通讯作者:
    尾川 順子
Markov logic network を事前分布に持つ潜在変数モデルの検討
以马尔可夫逻辑网络为先验分布的潜变量模型检验
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    秋元 康佑;武石 直也;堀 浩一;矢入 健久
  • 通讯作者:
    矢入 健久
アンサンブル木学習によるノンパラメトリックなセンサー値正常範囲推定
使用集成树学习的非参数传感器值正常范围估计
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    秋元 康佑,武石 直也;矢入 健久;堀 浩一,西村 尚樹;高田 昇
  • 通讯作者:
    高田 昇

矢入 健久的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('矢入 健久', 18)}}的其他基金

潜在健全指標モデルによるシステム状態予測と運用最適化に関する研究
利用潜在健康指标模型进行系统状态预测和运行优化研究
  • 批准号:
    24K01110
  • 财政年份:
    2024
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
航空宇宙機器システムの次世代健康監視のための弾力的情報学プラットフォーム
用于下一代航空航天设备系统健康监测的弹性信息学平台
  • 批准号:
    16F16079
  • 财政年份:
    2016
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
宇宙機故障発見のためのデータマイニング手法に関する研究
发现航天器故障的数据挖掘方法研究
  • 批准号:
    14750717
  • 财政年份:
    2002
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
無人宇宙機の自律的マネジメントと耐故障化に関する研究
无人航天器自主管理与容错研究
  • 批准号:
    96J04297
  • 财政年份:
    1998
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似海外基金

学習過程情報に基づき理由を説明可能な高速論理型機械学習器の開発の提案
开发可根据学习过程信息解释原因的高速逻辑机器学习装置的提案
  • 批准号:
    24K15095
  • 财政年份:
    2024
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
ClinEX - Clinical Evidence Extraction, Representation, and Appraisal
ClinEX - 临床证据提取、表示和评估
  • 批准号:
    10754029
  • 财政年份:
    2023
  • 资助金额:
    $ 1.41万
  • 项目类别:
前向き推論から物理法則を導出する情報物理教材の開発とプラットフォームへの実装
正向推理物理定律的信息物理教材开发并在平台上实现
  • 批准号:
    23K02729
  • 财政年份:
    2023
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Development and application of learning theory for uncertainty in Bayesian deep learning based on multi-objective optimization
基于多目标优化的贝叶斯深度学习不确定性学习理论发展及应用
  • 批准号:
    23K16948
  • 财政年份:
    2023
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Construction of Bayesian Optimal Decision Tree Algorithm Using Metatree and Latent Class Tree by Information Theory
基于信息论的元树和潜在类树构建贝叶斯最优决策树算法
  • 批准号:
    23K03863
  • 财政年份:
    2023
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了