Acquisition of understandable latent variable space in deep learning

深度学习中可理解的潜变量空间的获取

基本信息

  • 批准号:
    21K12066
  • 负责人:
  • 金额:
    $ 2.66万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2021
  • 资助国家:
    日本
  • 起止时间:
    2021-04-01 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

三年にわたる本研究課題の二年目として、主に(1)画像特徴の周波数成分に応じた潜在空間の獲得、(2)顔面神経麻痺の発症部位および程度に応じた潜在空間の獲得、(3)複数Encoderを用いた非冗長な潜在空間の獲得、の三件のテーマに主に取り組んで実験を行った。各テーマとも、主に学習用データベースの構築と比較的シンプルなモデルでのシミュレーション実験が中心である。(1)では高解像度の顔画像データベースを段階的にダウンスケールしたデータベース20000セットを構築し、StyleGANを元にしたネットワークを用いて、解像度ごとに表現可能な特徴を個別の潜在空間にまとめる実験を行った。(2)では顔面神経麻痺患者および健常者、計43人の表情変化を収録した顔画像データベースを構築し、複数の目的別に作成したEncoderおよびDiscriminatorを用いることで個人の顔形状に起因する特徴と顔面神経麻痺の発症部位および程度に起因する特徴の切り分けを行った。(3)では、主にMNISTやCifer10などの公開データセットを使用して、多目的学習を多段的に実施することで複数のEncoderに非冗長な潜在空間を獲得させ、データの特性に応じた直感的な特徴マップの獲得を行った。いずれの研究においても現状ではそれぞれに課題を抱えているものの、従来法と比べて一定の成果を得た。これらの実験および派生の研究テーマに関して、国内会議13件、国際会議6件、国際学会論文1件ですでに発表を実施した。また、査読を通過した未公開の国際学会論文が1件ある。
Three years later, this research topic was divided into two parts: (1) acquisition of latent space for frequency components of image features;(2) acquisition of latent space for severity of facial paralysis;(3) acquisition of non-lengthy latent space for multiple Encoder applications; and (4) acquisition of three main components for image features. Each class is composed of two classes, one class and the other class. (1)High resolution color image design for 2000s, StyleGAN design for 2000s, resolution for 2000s, performance for 2000s, and potential for 2000s. (2)Facial portrait data from 43 patients with facial paralysis, both normal and healthy, were built to record facial expression changes, and Encoder and Discriminator were used to create multiple target categories to distinguish between the characteristics caused by an individual's facial shape and the characteristics caused by the location and degree of facial paralysis. (3)For example, the main character MNIST and Cifer10 are used for multi-stage learning, and the non-redundant potential space of the multiple encoder is obtained. In the middle of the study, the current situation is different from that of the previous study. This paper was published in 13 domestic conferences, 6 international conferences and 1 international academic paper. 1 unpublished international academic paper

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Consistency正則化を取り入れたStackGANによるテキスト入力に基づく画像生成
使用 StackGAN 结合一致性正则化基于文本输入生成图像
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    冨永理人;瀬尾昌孝
  • 通讯作者:
    瀬尾昌孝
Automatic Generation of High-Resolution Facial Expression Images with End-To-End Models Using Pix2Pix and Super-Resolution Convolutional Neural Network
使用 Pix2Pix 和超分辨率卷积神经网络通过端到端模型自动生成高分辨率面部表情图像
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tatsuya Hanano;Masataka Seo;Yen-Wei Chen
  • 通讯作者:
    Yen-Wei Chen
Simulation of Facial Palsy Using an Improved Cycle GAN and Face Restoration Network
使用改进的循环 GAN 和面部恢复网络模拟面瘫
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Takato Sakai;Masataka Seo;Naoki Matsushiro;Yen-Wei Chen
  • 通讯作者:
    Yen-Wei Chen
深層生成モデルを用いた洋服の特徴選定および特徴付与による着せ替え画像生成
通过选择服装特征并使用深度生成模型添加特征来生成装扮图像
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    草野快;瀬尾昌孝
  • 通讯作者:
    瀬尾昌孝
敵対的生成ネットワークを用いたマルチタスクラーニングによる高解像度の表情顔画像生成
使用生成对抗网络的多任务学习生成高分辨率面部图像
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    花野達也;瀬尾昌孝;陳延偉
  • 通讯作者:
    陳延偉
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

瀬尾 昌孝其他文献

瀬尾 昌孝的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('瀬尾 昌孝', 18)}}的其他基金

照明条件、化粧効果を考慮した三次元顔画像における美顔補正
考虑光照条件和化妆效果的 3D 面部图像中的面部美化校正
  • 批准号:
    12J09415
  • 财政年份:
    2012
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似海外基金

Scholar2Vec: 研究者の多様な活動情報を埋め込める深層潜在空間の構築
Scholar2Vec:构建深层潜在空间,可以嵌入研究人员多样化活动的信息
  • 批准号:
    23K20410
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
制約付き固有値問題に基づく局所潜在空間生成とその大規模分散データ解析への応用
基于约束特征值问题的局部潜在空间生成及其在大规模分布式数据分析中的应用
  • 批准号:
    23K28101
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
潜在空間最適構成理論の構築と経済学、医学、生成系AIへの応用
潜在空间最优构造理论构建及其在经济学、医学和生成人工智能中的应用
  • 批准号:
    24H00703
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
制約付き固有値問題に基づく局所潜在空間生成とその大規模分散データ解析への応用
基于约束特征值问题的局部潜在空间生成及其在大规模分布式数据分析中的应用
  • 批准号:
    23H03411
  • 财政年份:
    2023
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
深層生成モデルの潜在空間の探索からの異常パターンの生成と理解
通过探索深层生成模型的潜在空间来生成和理解异常模式
  • 批准号:
    22K17912
  • 财政年份:
    2022
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
潜在空間モデルのデータベースを用いた力計測不要の動力学的身体動作伝授
使用潜在空间模型数据库进行动态身体运动指令,无需进行力测量
  • 批准号:
    21K20412
  • 财政年份:
    2021
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
Scholar2Vec: 研究者の多様な活動情報を埋め込める深層潜在空間の構築
Scholar2Vec:构建深层潜在空间,可以嵌入研究人员多样化活动的信息
  • 批准号:
    20H04484
  • 财政年份:
    2020
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
非公理的論理と潜在空間表象に基づく創造的記号処理モデル
基于非公理逻辑和潜在空间表示的创意符号处理模型
  • 批准号:
    20K21812
  • 财政年份:
    2020
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了