三次元空間情報を用いた実世界質問応答基盤の創出
使用 3D 空间信息创建现实世界问答平台
基本信息
- 批准号:22K12159
- 负责人:
- 金额:$ 2.58万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2022
- 资助国家:日本
- 起止时间:2022-04-01 至 2025-03-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
本研究では、申請者がこれまで取り組んできた二次元動画像の視覚的質問応答手法と近年発展が著しい三次元空間認識技術を統合することで、三次元空間情報について自然言語を介して問い合わせできる三次元空間質問応答技術を確立する。複数の屋内環境をRGB-Dスキャンした三次元空間情報の質問応答データセットを作成し、従来の2D-VQAとの比較検証を行い、実空間の意味的・立体的理解が必要な問い合わせに三次元空間データが有用であることを実証する。今年度は以下の項目に取り組んだ。①三次元空間質問応答データセットの作成:三次元空間質問応答モデルの学習と評価を行うため、三次元空間質問応答データセットを作成した。質問応答データセットの作成は、質問回答の自動生成と手動によるアノテーションのハイブリッド形式を採用した。三次元空間情報のデータとしては、屋内環境をRGB-DスキャンしたデータセットScanNetを用いた。実空間のデータに対して手動だけで質問を作成すると、比較的簡単な質問が作成されてしまう問題があるため、ScanNetの環境内にある各物体に言語的記述を施したScanReferのデータに質問回答生成モデルを適用することで、三次元空間中の物体に対する質問とその解答を自動生成した。②三次元物体認識技術を用いた三次元空間質問応答モデルの開発:実空間をRGB-Dスキャンした三次元空間情報とその空間に関する自由形式の質問を入力とし、その質問と三次元空間データ(点群データ)に対応する回答を予測する視覚的質問応答モデルを開発した。視覚的質問応答のデータに三次元物体認識の結果を用いることで、物体の位置関係や形状を考慮しつつ、オクルージョンへの頑健性を高め、カメラ視点に左右されずに物体の同一性を保証した視覚的質問応答を可能とした。
This study aims to establish the inquiry and answer techniques for 2D animated images and 3D spatial information, which have been developed in recent years. A plurality of indoor environment, RGB-D space, three-dimensional space information, query and answer, comparison and verification of 2D-VQA, three-dimensional understanding of the meaning of space, and necessary questions. This year, the following items are selected. 1. Three-dimensional space query: three-dimensional space query Question answer creation, question answer automatic generation, question answer creation, question answer, question answer, The three-dimensional space information is used in the indoor environment. The simple question for creating and comparing a query in space is automatically generated by creating and applying a query for each object in ScanNet environment. 2. Three-dimensional object recognition technology uses three-dimensional space query to answer questions: spatial RGB-D query, three-dimensional space information, spatial relations, free-form query, input force, questions, three-dimensional space query (point group query), answer, prediction, visual query, answer. The result of recognition of three-dimensional objects is used in the visual query, and the positional relationship and shape of the objects are considered. The robustness of the objects is high, and the identity of the objects is guaranteed.
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
ScanQA: 3D Question Answering for Spatial Scene Understanding
- DOI:10.1109/cvpr52688.2022.01854
- 发表时间:2021-12
- 期刊:
- 影响因子:0
- 作者:Daich Azuma;Taiki Miyanishi;Shuhei Kurita;M. Kawanabe
- 通讯作者:Daich Azuma;Taiki Miyanishi;Shuhei Kurita;M. Kawanabe
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
宮西 大樹其他文献
宮西 大樹的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('宮西 大樹', 18)}}的其他基金
ネットワークの成長過程に基づくスケーラブルな時間付き特徴生成の実現
基于网络生长过程的可扩展时间特征生成的实现
- 批准号:
12J02449 - 财政年份:2012
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for JSPS Fellows
相似海外基金
ナラティブはどのようにして生じるのか?-自然言語処理技術を用いた検討-
叙事是如何出现的?
- 批准号:
24K16786 - 财政年份:2024
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
言語流暢性課題の定性的分析方法の構築:語彙特性と自然言語処理の応用
构建语言流畅性任务的定性分析方法:词汇特征和自然语言处理的应用
- 批准号:
24K10484 - 财政年份:2024
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
自然言語処理に最適な語彙と分割の仕方を自動で獲得する人工知能の創出
创建自动获取自然语言处理最佳词汇和切分方法的人工智能
- 批准号:
24K20852 - 财政年份:2024
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
能動学習を用いた、放射線科所見文重要度推定用自然言語処理システムの開発
开发自然语言处理系统,使用主动学习来评估放射学结果的重要性
- 批准号:
24K18797 - 财政年份:2024
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
自然言語処理を用いた重粒子線治療の適応判定のための自動チャットシステムの開発
开发自动聊天系统,利用自然语言处理确定重离子放射治疗的适用性
- 批准号:
24K18821 - 财政年份:2024
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
自然言語処理技術を用いた食物アレルゲン性予測システム構築
利用自然语言处理技术构建食物过敏性预测系统
- 批准号:
24K01707 - 财政年份:2024
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
自然言語処理を活用した皮質脳波解析による長文読解の神経ネットワーク基盤の解明
通过自然语言处理的皮层脑电图分析阐明长句阅读的神经网络基础
- 批准号:
24K18686 - 财政年份:2024
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
自然言語処理技術を用いた教授学習支援システムの開発
利用自然语言处理技术开发教学支持系统
- 批准号:
24K16768 - 财政年份:2024
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
自然言語処理を利用した1910-30年代の日本文芸批評の研究
利用自然语言处理研究 1910 年代至 1930 年代的日本文学批评
- 批准号:
24K15991 - 财政年份:2024
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
教師が客観的に授業を自己評価するための自然言語処理による新しい発話分析法の開発
使用自然语言处理开发一种新的语音分析方法,供教师客观地自我评估他们的课程
- 批准号:
23K12785 - 财政年份:2023
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Early-Career Scientists














{{item.name}}会员




