画像意味理解のためのクラスタリングによる特徴抽出

通过聚类提取特征以理解图像含义

基本信息

  • 批准号:
    20650025
  • 负责人:
  • 金额:
    $ 2.11万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Exploratory Research
  • 财政年份:
    2008
  • 资助国家:
    日本
  • 起止时间:
    2008 至 无数据
  • 项目状态:
    已结题

项目摘要

本年度(〜平成21年3月31日)の研究実施計画本研究では、一般画像認識において、学習画像群から対象物体を適切に識別できる特徴量を精密に求める手法について検討する。学習画像群から得た特徴量は、精密に求めた適切なパラメータに基づいて算出されていれば、特徴空間中で対象物体を特徴付ける構造に対応するクラスタを構成すると考えられる。そこで、より識別性能を高めるようなクラスタを形作るように特徴量算出のパラメータを調整することにより、一般画像認識に有効な特徴量を抽出することを考えている。そのため、本研究では、従来比較的独立に研究されてきた、統計解析・データ工学に基づくクラスタ解析と、画像解析との研究領域間の密な結合に基づいて取り組む。平成20年度は、TRECVIDデータを対象として映像/画像の概念カテゴリへの分類について検討を行った。局所特徴量に基づく方法により、上記の考え方に従い、識別性能を最適化するように局所特徴量のクラスタリングを修正する実験を行った。その結果、分類性能は確かに高くなることが分かったが、過学習に陥りやすいという問題点があることも分かった。一方、別途検討した大局特徴量に基づく概念分類手法では、過学習の問題も少なく、かつ性質の異なるデータで学習しても識別性能が落ちにくい(cross-domain特性がよい)ことも分かった。一方、顔画像の識別問題について上記と同様のアプローチを取り、Webから取得した大量の顔画像に対して、顔類似度の点でより良いクラスタを検出するように顔検出器を学習させることにより、有名人を主たる対象とした特定人物の検出器を自動学習するアルゴリズムを考案した。
This year (March 31, 2009), the research plan is to study the general portrait recognition, study the portrait group, identify the object appropriately, and accurately calculate the characteristics. Learning the image group to obtain the appropriate feature quantity, precise calculation, calculation of the corresponding object in the feature space, construction of the corresponding object in the feature space, examination of the corresponding object composition. For example, if you want to know more about the image, you can use the image recognition method to calculate the image feature. This study is a combination of independent research, statistical analysis, engineering analysis, and portrait analysis. In 2010, TREVID was released to the public. The basic method of the local feature quantity is to optimize the recognition performance of the local feature quantity and modify the recognition performance of the local feature quantity. The result, classification performance is high, the problem is high, the problem is high, and the problem is high. A party, a different way to discuss the overall characteristics of the basic concept classification method, the problem of learning, the difference between the nature of the learning, the recognition performance of all (cross-domain characteristics). The problem of face recognition is to record and retrieve the same face image, to obtain a large number of face images, to detect the face similarity, to detect the face detector, to learn from the face detector, and to automatically learn from the face detector.

项目成果

期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Robust Face Track Finding in Video Using Tracked Points
使用跟踪点在视频中进行稳健的人脸跟踪查找
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Duc Thanh Ngo;Duy-Dinh Le;Shin'ichi Satoh Anh Duc Duong
  • 通讯作者:
    Shin'ichi Satoh Anh Duc Duong
Efficient Concept Detection By Fusing Simple Visual Features.
通过融合简单的视觉特征进行有效的概念检测。
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Duy-Dinh Le;Shin'ichi Satoh
  • 通讯作者:
    Shin'ichi Satoh
"Face Detection, Tracking, and Recognition for Broadcast Video, " in Borko Furht ed. "Encyclopedia of Multimedia, 2nd Edition, "
“广播视频的人脸检测、跟踪和识别”,Borko Furht 编辑。
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Duy-Dinh Le;Xiaomeng Wu;Shin'ichi Satoh
  • 通讯作者:
    Shin'ichi Satoh
“Video Near-Duplicate Detection, " in Borko Furht ed., “Encyclopedia of Multimedia, 2nd Edition, "
“视频近似重复检测”,Borko Furht 编辑,“多媒体百科全书,第二版”
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    大丘達也;藤田欣也;Shin'ichi Satoh
  • 通讯作者:
    Shin'ichi Satoh
Unsupervised Face Annotation by Mining the Web
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

佐藤 真一其他文献

コンピュータ強化キッチンによるインタラクティブ調理支援
通过计算机增强厨房提供交互式烹饪支持
Boosting Image Retrieval by Diffusion
通过扩散增强图像检索
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    河江肖剰;佐藤悦夫;佐藤昇;高橋亮介その他;渡辺美季;李成市;阿部芳弘・日下宗一郎・米田穣ほか;清水哲郎;高田智和;佐藤宏之;佐藤 真一;山花京子;高田智和;グエン・ティ・フォン・トム;小関悠一郎;会田薫子;高橋龍三郎;山田康弘;Shin'ichi Satoh
  • 通讯作者:
    Shin'ichi Satoh
ALD法で成膜したAlOxパッシベーションのバンド構造評価
ALD法形成的AlOx钝化膜的能带结构评价
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    池野 成裕,山下 祥弘;陰地 宏;三木 祥平;新船 幸二; 吉田 晴彦;佐藤 真一;廣沢 一郎;知京 豊裕;小椋 厚志
  • 通讯作者:
    小椋 厚志
大容量放送映像アーカイブからの同一フラッシュシーン映像の発見
从大容量广播视频档案中发现相同的Flash场景视频
マルチメディア検索と深層学習
多媒体搜索和深度学习

佐藤 真一的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('佐藤 真一', 18)}}的其他基金

Provable, Explainable, Efficient, Robust Deep Neural Network for Large-scale Multimedia Retrieval
用于大规模多媒体检索的可证明、可解释、高效、鲁棒的深度神经网络
  • 批准号:
    22KF0369
  • 财政年份:
    2023
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Construction of metric space for datasets and learning algorithms
数据集和学习算法的度量空间构建
  • 批准号:
    22H03620
  • 财政年份:
    2022
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
証明可能・説明可能・効率的・頑健な深層学習と大規模マルチメディア検索への応用
可证明、可解释、高效、鲁棒的深度学习及其在大规模多媒体搜索中的应用
  • 批准号:
    21F20377
  • 财政年份:
    2021
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
証明可能・説明可能・効率的・頑健な深層学習と大規模マルチメディア検索への応用
可证明、可解释、高效、鲁棒的深度学习及其在大规模多媒体搜索中的应用
  • 批准号:
    21F40377
  • 财政年份:
    2021
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
証明可能・説明可能・効率的・頑健な深層学習と大規模マルチメディア検索への応用
可证明、可解释、高效、鲁棒的深度学习及其在大规模多媒体搜索中的应用
  • 批准号:
    20F20377
  • 财政年份:
    2020
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Known Re-identification, Unknown Detection, and Their Behavior Discovery
已知的重识别、未知的检测及其行为发现
  • 批准号:
    18F18378
  • 财政年份:
    2018
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
大規模マルチモーダルアーカイブの視覚情報に基づく解析
基于可视化信息的大规模多模式档案分析
  • 批准号:
    15F14773
  • 财政年份:
    2015
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
大規模マルチメディアコーパスによる映像合成に関する研究
基于大规模多媒体语料库的视频合成研究
  • 批准号:
    12F02712
  • 财政年份:
    2012
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
視覚情報とテキスト情報とを統合した映像検索のための映像シソーラスの構築
构建集成视觉和文本信息的视频搜索视频词库
  • 批准号:
    16016289
  • 财政年份:
    2004
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
視覚情報とテキスト情報とを統合した映像検索のための映像シソーラスの構築
构建集成视觉和文本信息的视频搜索视频词库
  • 批准号:
    15017285
  • 财政年份:
    2003
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了