A study of human perceptual-motor learning process using reward estimation in inverse reinforcement learning

在逆强化学习中使用奖励估计研究人类感知运动学习过程

基本信息

  • 批准号:
    20K12576
  • 负责人:
  • 金额:
    $ 2.75万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2020
  • 资助国家:
    日本
  • 起止时间:
    2020-04-01 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

日常生活や仕事、スポーツ等で必要な様々な技能を獲得する過程の解明および学習を促進する手段の開発は古くから心理学の一大テーマであり、近年でも潜在学習や状況的学習の概念の下で様々な研究が行われている。この種の学習はその過程を言語化することが難しいため、内的な学習プロセスを検討するにはパフォーマンスの量的測定結果からの推定法が重要となる。この研究では、機械学習およびロボット制御の分野で開発された「逆強化学習」という計算モデルを利用して、学習者がその学習過程で実際に活用した報酬関数を時系列を追って推定し、この報酬関数の変化と、学習の過程で与えられた顕在的知識(アドバイス) や個人の知識の顕在化(テスト)との関係を検討する。これによって、潜在・顕在過程のインターラクションを含んだ知覚―運動学習の量的モデル化に繋げられると期待できる。逆強化学習は、パフォーマンス(参加者が押したキーの系列 等)から、参加者が用いた報酬を推定しようとするものである。現段階までのところ、研究代表者がこれまでの知覚―運動学習の研究で用いてきた知覚マッチング課題をベースとして、報酬の推定を行うための逆強化学習計算モデルの導出を行い、過去の実験における人間のパフォーマンス記録(キー押し系列の記録)に基づく解析を行った。また、解析の精度を高めるために、より詳細に参加者の行動変容を捉えられる自由度の高い入力装置(トラックパッド)用いた、より自然かつ単純な知覚ー運動マッチング状況を模した課題(軌跡学習課題)の作成をした。今後、この課題を用いて、新たな実験データの取得と報酬関数の推定を行う計画である。
Daily life, career, etc., the process of acquiring skills, understanding and promoting learning, the development of ancient psychology, and the development of potential learning and learning concepts in recent years. The process of this kind of learning is very difficult, and the method of estimation is very important. This study discusses the relationship between machine learning, control and development of inverse reinforcement learning, calculation and utilization, learner learning process, compensation and time series, compensation and transformation, learning process and existing knowledge and individual knowledge. This is the first time that we've seen a change in the way we look forward to it. Reverse reinforcement learning is the process of determining the participant's salary. The current stage of the study, the representative of the study, the use of knowledge, the topic of evaluation, the estimation of compensation, the derivation of inverse reinforcement learning, the past of the human record (the record of the series), the analysis of the basis The accuracy of analysis is high, the movement of participants is high, and the problem (trajectory learning problem) is created. In the future, this issue will be discussed in detail, and new projects will be implemented to obtain and estimate compensation.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

薬師神 玲子其他文献

プロジェクション・サイエンス
投影科学
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鈴木宏昭;田中 彰吾;大住 倫弘;信迫 悟志;嶋田 総太郎;森岡 周;鳴海 拓志;小野 哲雄;中田 龍三郎;川合 信幸;外山 紀子;久保(川合)南海子;鳥居 修晃;望月 登志子;薬師神 玲子
  • 通讯作者:
    薬師神 玲子

薬師神 玲子的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('薬師神 玲子', 18)}}的其他基金

逐次効率分析による同時知覚学習の動的プロセスの検討
通过顺序效率分析检查同步感知学习的动态过程
  • 批准号:
    18730469
  • 财政年份:
    2006
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
知覚学習への逐次効率分析アプローチ
感知学习的顺序效率分析方法
  • 批准号:
    15730339
  • 财政年份:
    2003
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
効率分析による選択的注意メカニズムの研究
通过效率分析研究选择性注意机制
  • 批准号:
    13710031
  • 财政年份:
    2001
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
多変数効率分析による視覚情報処理過程の研究
利用多元效率分析研究视觉信息处理过程
  • 批准号:
    11710030
  • 财政年份:
    1999
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

再現実験およびシミュレーションによる実社会転倒挙動のモデル化と危害軽減方策の開発
通过再现实验和模拟对现实世界的跌倒行为进行建模并制定减少伤害的措施
  • 批准号:
    23K21021
  • 财政年份:
    2024
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
コンテキストに依存する概念変容のモデル化による目的指向プロセスデザインの深化
通过对上下文相关的概念转换进行建模来深化面向目标的流程设计
  • 批准号:
    23K21698
  • 财政年份:
    2024
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
照射脆化耐性を向上する析出相強靭化法の開発とローカルアプローチによるモデル化
开发沉淀增韧方法以提高抗辐射脆性并使用局部方法进行建模
  • 批准号:
    23K25849
  • 财政年份:
    2024
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
スケーリング則を持つ脊椎動物組織のパターン形成機構の数理モデル化と実験的検証
具有标度规律的脊椎动物组织模式形成机制的数学建模和实验验证
  • 批准号:
    24K02036
  • 财政年份:
    2024
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
コロナ禍の影響を考慮したコンテナ船市場のモデル化とその将来影響の評価
考虑冠状病毒大流行的影响对集装箱船市场进行建模并评估其未来影响
  • 批准号:
    24K07940
  • 财政年份:
    2024
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
操船者の他船動向に対する思い込み発生時における状況認識のモデル化
当船舶运营商对其他船舶的运动做出假设时进行态势感知建模
  • 批准号:
    24K07900
  • 财政年份:
    2024
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
膜型人工肺酸素移動量のモデル化による性能評価法の提案
基于膜式氧合器氧传递建模的性能评价方法的提出
  • 批准号:
    24K12179
  • 财政年份:
    2024
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
過去20万年間の気候・海水準変動への河川システムの応答の解明とそのモデル化
过去 20 万年河流系统对气候和海平面变化的响应的阐明和建模
  • 批准号:
    24KJ0826
  • 财政年份:
    2024
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
バッチ型確率的最適化手法を応用した交通ネットワークの復興過程のモデル化と施策評価
使用批量随机优化方法进行交通网络重建过程建模和政策评估
  • 批准号:
    24K17369
  • 财政年份:
    2024
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
教員の学習指導・授業づくりにおける暗黙知の定量モデル化
教师学习指导和备课中隐性知识的定量建模
  • 批准号:
    24K16754
  • 财政年份:
    2024
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了