広域3D環境に関するニューラル暗黙表現の学習とその応用に関する研究

神经隐式表示学习及其在广域3D环境中的应用研究

基本信息

  • 批准号:
    22K12166
  • 负责人:
  • 金额:
    $ 2.25万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-04-01 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

本研究の目的は広域3次元環境に対しても適用可能な3次元暗黙表現を学習するための手法を確立することである。このための基本方式としてはencoder-decoder型の処理を用いることを想定している。今年度の研究においては、入力として複数画像を用いた場合の全体手法の考案、visual transformerを含む種々のencoderの方式の検討、さらに、encoder出力として得られるテンソルを入力の特徴量とみなした場合の形状類似度検索への適用可能性の検討などを行った。今年度の研究においては、3次元モデル構築のために複数画像を入力とする方式として、画像間の照合などは行わず、画像枚数も上限のみを設定するものの、入力数を自由に設定できる方式を考案した。またこれらの入力に対して適用するencoderとしては、従来画像識別で高い能力が実証されているResNetと近年自然言語処理の分野で広く用いられ、画像等への適用も進んでいる(vision) transformerを用い、能力比較を行った。本方式では画像間の照合などは行わず順序関係を与えることはできない。このような並べ替えに対する不変性を保証するためにはmax-poolingやtransformerの場合はpositional encodingをあえて行わない方式を用いた。これらの手法の適用により構築される3Dモデルを従来手法のひとつであるDISN(deep implicit surface network)と比較し、同等以上の能力を有することを確認した。このようなencoder-decoder型の処理の際、encoderから得られるテンソル表現は入力の特徴量とみなすことができる。これらが形状類似度検索に適用できるかどうかの基礎検討に着手した。
The purpose of this study is to make sure that the three-dimensional environmental environmental information system can be used to demonstrate the accuracy of the three-dimensional environmental information system. In the basic way, you can use the encoder- decoder model to figure out what to do. In this year's research, the complex portraits have been tested by using the whole method, and the visual transformer contains a variety of encoder methods to improve the performance of the system. The results show that there are several ways to improve the performance of the system, such as the number of parameters, the size of the shape, the similarity of the shape, the possibility of the use of the device, the possibility of the use of the model, the possibility of the application, the possibility of the application, and the feasibility of the model. This year, we have studied the number of images, the number of three-dimensional images, the number of images in portraits, the images between portraits, the upper limit of the number of portraits, and the number of forces that can be set to set the system. In recent years, there has been a difference in the use of natural language in recent years, such as the use of pictures, portraits, and so on. In recent years, there has been a distinction between the use of encoder and the use of portraits, portraits, etc., in recent years, there has been a natural understanding of the nature of the language in recent years. In recent years, there has been a difference in the use of natural language, such as portraits, portraits, and so on. (vision) transformer is used, and the ability is better than that. In this way, the pictures are taken in conjunction with each other, in the order of the image and in the image. You can use the same information as you would like to know if you want to make sure that you have sex. You need to max-pooling your transformer to make sure that you use the same method as you would like to do. The technique is more accurate than the DISN (deep implicit surface network), which is equivalent to the above ability. In the encoder- decoder model, the encodery decoder can be used to show that the input force is very high. The size of the shape is similar to that of the hand.

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Transformerによる単一および複数視点画像からの3D再構成
使用 Transformer 从单视图和多视图图像进行 3D 重建
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小林和輝;宮尾秀俊;丸山稔
  • 通讯作者:
    丸山稔
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

丸山 稔其他文献

Sigfoxネットワークとヘテロコア光ファイバセンサを組み合わせたIoTモニタリングシステムの提案
结合Sigfox网络和异核光纤传感器的物联网监控系统提案
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    伊藤 勇弥;白井 啓一郎;宮尾 秀俊;丸山 稔;犬塚亮,吉田俊之;雙松伸一,山崎大志,渡辺一弘
  • 通讯作者:
    雙松伸一,山崎大志,渡辺一弘
複数の色や成分を扱う画像処理における画素ごとの特異値分解の計算効率化の検討
处理多种颜色和成分的图像处理中提高每个像素奇异值分解计算效率的研究
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    伊藤 勇弥;白井 啓一郎;宮尾 秀俊;丸山 稔
  • 通讯作者:
    丸山 稔
木簡画像に対する SVM を用いた背景領域の検出法の検討
基于SVM的木碑图像背景区域检测方法研究
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    岡谷 陽平;白井 啓一郎;宮尾 秀俊;丸山 稔
  • 通讯作者:
    丸山 稔
240P動画像に対する時間方向のMOS予測手法
240P视频图像的时间MOS预测方法
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    伊藤 勇弥;白井 啓一郎;宮尾 秀俊;丸山 稔;犬塚亮,吉田俊之
  • 通讯作者:
    犬塚亮,吉田俊之
カラーライン特徴を用いた画像処理における画素ごとの特異値分解の計算効率化の検討
利用颜色线特征提高图像处理中每个像素奇异值分解计算效率的研究
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    伊藤 勇弥;白井 啓一郎;宮尾 秀俊;丸山 稔
  • 通讯作者:
    丸山 稔

丸山 稔的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('丸山 稔', 18)}}的其他基金

例題からの学習に基づく3次元環境モデルの構築に関する研究
基于实例学习的3D环境模型构建研究
  • 批准号:
    09780323
  • 财政年份:
    1997
  • 资助金额:
    $ 2.25万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
NMRとX線回折による多孔質ガラス中の不凍水・疑似液体の研究
利用NMR和X射线衍射研究多孔玻璃中的防冻水和伪液体
  • 批准号:
    08640425
  • 财政年份:
    1996
  • 资助金额:
    $ 2.25万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
結晶形態と固液界面構造に及ぼす圧力の効果
压力对晶体形貌和固液界面结构的影响
  • 批准号:
    06640452
  • 财政年份:
    1994
  • 资助金额:
    $ 2.25万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了