Object State Change Detection and Human Behavior Prediction Focused on Hand Manipulation

专注于手部操作的物体状态变化检测和人类行为预测

基本信息

  • 批准号:
    21J11626
  • 负责人:
  • 金额:
    $ 0.96万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2021
  • 资助国家:
    日本
  • 起止时间:
    2021-04-28 至 2023-03-31
  • 项目状态:
    已结题

项目摘要

2021年度は、一人称視点映像中において手と物体が触れているか否かを時系列で予測する手-物体接触判定(テーマA)の問題およびテーマBに必要な技術として映像中に出現する物体をインスタンス単位で識別する問題に取り組んだ。手-物体接触判定では、未知の手と物体の組における接触状態の推論を行うために (i) 手と物体の運動方向の相関による疑似ラベルの生成に基づく半教師あり学習 (ii) 誤りを含む疑似ラベルを少数の正しいラベルを含む訓練データを基に訓練中に逐次的にラベル訂正を行う方法 の2つの提案を行った。また、評価のために自然な調理動作を含むEPIC-KITCHENSデータセット上に新たにアノテーションを付与し、同データセット上で先行手法および教師データのみを用いて訓練した場合と比して高い性能を達成した。物体インスタンス識別はある物体に対して発生する手-物体インタラクションを長時間追跡するために異なる時刻に出現する同一のインスタンスを識別する上で重要なタスクである。本年度はユーザが物体とインタラクションを行う動的環境においてどの程度インスタンスの識別が行えるかの検証を行った。具体的には、EPIC-KITCHENSデータセット上に新たに1,500以上のインスタンスを含む大規模かつ挑戦的なベンチマークを構築し、表現学習に基づく高精度を達成するベースラインモデルおよび本ベンチマークに出現する特有の難しさの分析を行った。当初予定していた作用物体の検出(テーマA後半)、物体状態変化検出(テーマB)、人物行動予測(テーマC)については採用終了のため着手できなかった。
在2021年,我们解决了手动对象的联系确定(主题A)的问题,该问题从按时间顺序预测,在第一人称视频中是否触摸了手和对象,以及识别视频中出现在实例上的对象的问题,是基于主题B.在Hand-of-possient contractiation中所必需的。基于手和物体运动方向之间的相关性,以及(ii)基于包含一些正确标签的训练数据,在训练过程中依次纠正标签的方法。此外,对Epic-Kitchens数据集进行了新的注释,其中包括自然烹饪操作,比仅使用先前的方法和教师数据在数据集中接受培训时获得更高的性能。对象实例标识是确定在不同时间出现相同实例以跟踪对象长期发生的手动相互作用的重要任务。今年,我们验证了在用户与对象交互的动态环境中可以识别实例的程度。具体而言,我们在Epic-Kitchens数据集上建立了一个大规模的,具有挑战性的基准,并分析了基线模型,并分析了基线模型,该模型基于表示的学习以及在此基准中出现的独特挑战,从而实现了很高的精度。由于终止采用终止,无法进行初步计划的活动对象(主题A的后半部分),对象状态(主题B)的变化(主题B)和人行为(主题C)的预测。

项目成果

期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
GO-Finder: A Registration-Free Wearable System for Assisting Users in Finding Lost Objects via Hand-Held Object Discovery
誘導付き逐次ラベル訂正に基づく映像からの手-物体接触判定
基于引导顺序标签校正的视频手部物体接触检测
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    八木拓真;Md. Tasnimul Hasan;佐藤洋一
  • 通讯作者:
    佐藤洋一
GO-Finder: A Registration-free Wearable System for Assisting Users in Finding Lost Hand-held Objects
  • DOI:
    10.1145/3519268
  • 发表时间:
    2022-11
  • 期刊:
  • 影响因子:
    3.4
  • 作者:
    Takuma Yagi;Takumi Nishiyasu;Kunimasa Kawasaki;Moe Matsuki;Yoichi Sato
  • 通讯作者:
    Takuma Yagi;Takumi Nishiyasu;Kunimasa Kawasaki;Moe Matsuki;Yoichi Sato
Hand-Object Contact Prediction via Motion-Based Pseudo-Labeling and Guided Progressive Label Correction
  • DOI:
  • 发表时间:
    2021-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Takuma Yagi;Md. Tasnimul Hasan;Yoichi Sato
  • 通讯作者:
    Takuma Yagi;Md. Tasnimul Hasan;Yoichi Sato
GO-Finder: Registration-Free Wearable System for Assisting Users in Finding Lost Objects via Hand-Held Object Discovery
GO-Finder:免注册可穿戴系统,通过手持物体发现帮助用户寻找丢失的物体
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Chen Jianlin;Tsukamoto Takashiro;Tanaka Shuji;八木拓真,西保匠,川崎邦将,松木萌,佐藤洋一
  • 通讯作者:
    八木拓真,西保匠,川崎邦将,松木萌,佐藤洋一
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

八木 拓真其他文献

購買行動において認知的不協和を顕在化し解消を促進する窓エージェントの提案と検討
揭示并促进解决购买行为认知失调的窗口代理的提案和研究
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    福嶋 稜;八木 拓真;馬場 惇;岩本 拓也;遠藤 大介;大澤 正彦
  • 通讯作者:
    大澤 正彦

八木 拓真的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('八木 拓真', 18)}}的其他基金

Object State Recognition via Multi-Modal Analysis of Videos and Video Caption Sequences
通过视频和视频字幕序列的多模态分析进行对象状态识别
  • 批准号:
    22K21296
  • 财政年份:
    2022
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
一人称視点映像からの移動と会話を伴う社会的行動の統合モデリング
第一人称视角视频中涉及运动和对话的社会行为综合建模
  • 批准号:
    19J21324
  • 财政年份:
    2019
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似海外基金

形状理解のためのマルチモーダル学習による、敵対的摂動に頑健な画像認識モデル開発
使用多模态学习进行形状理解,开发对对抗性扰动具有鲁棒性的图像识别模型
  • 批准号:
    24KJ0716
  • 财政年份:
    2024
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
熱画像を用いた超重症児の情動理解を支援する簡便な測定法の提案
提出一种使用热成像的简单测量方法来支持危重儿童的情绪理解
  • 批准号:
    24H02472
  • 财政年份:
    2024
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for Encouragement of Scientists
画像・生理解析によるBAFMEの病態解明:不随意運動か、てんかんか、変性疾患か
通过图像和生理分析阐明 BAFME 的病理:是不自主运动、癫痫还是退行性疾病?
  • 批准号:
    23K14774
  • 财政年份:
    2023
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
動的現象としてみた初期視覚系の数理モデル:遅延微分方程式による画像強調効果の理解
被视为动态现象的早期视觉系统的数学模型:使用延迟微分方程理解图像增强效果
  • 批准号:
    22K12180
  • 财政年份:
    2022
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
動画像理解のための時空間情報設計の方法論構築
视频图像理解时空信息设计方法论的建立
  • 批准号:
    22K12090
  • 财政年份:
    2022
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了