大規模映像資源のためのマルチモーダルセマンティックインデクシング
大规模视频资源的多模态语义索引
基本信息
- 批准号:11J04223
- 负责人:
- 金额:$ 1.22万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2011
- 资助国家:日本
- 起止时间:2011 至 2013
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本年度は、大規模映像資源に対するマルチモーダルなセマンティックインデクシングシステムの構築に向けて、前年度までに作成したシステムの高速化を行う手法を開発した。セマンティックインデクシングとは、映像の中から物体やイベントなど、意味を持った対象を自動的に検出し、映像の意味的分類を行うことである。セマンティックインデクシングは、意味に基づいた高度な映像検索への応用が期待される研究課題であり、画像、音声、言語に基づいたマルチモーダルな手法の開発が必要とされている。さらに、大規模なデータの処理に向けて、高速な特徴抽出アルゴリズムが不可欠である。そこで、本年度は、Neighbor-to-Neighbor (NTN)探索という高速化手法を新たに開発した。NTN探索は、ベクトル量子化や混合ガウス分布に関する確率計算を高速化する手法であり、入力となる特徴量の中から類似したものを探索し、類似度に応じて計算を省略することで高速化を実現する。PASCAL VOCデータセットにおける評価実験では、これまでに作成した混合ガウス分布を用いたセマンティックインデクシングシステムにNTN探索を導入することで、検出精度を高く保った状態で、89.3%の計算量削減を実現した。また、映像解析に関する国際的ワークショップであるTRECVIDのセマンティックインデクシングタスクにおける評価実験では、6種類の画像・音響特徴量とこれまでに開発した手法を統合して用いることで、映像検出精度がタスク参加18機関中第3位となり、精度・計算量の両観点から、我々の手法の有用性が確認された。
This year's large-scale image resource collectionステムのconstructionに向けて, the previous year's までに成したシステムのHIGH-SPEEDING を行うtechniqueを开発した.セマンティックインデクシングとは、imageの中からobjectやイベントなど、 Meaning: をholding った対 resembles をautomatic に検出し, image のmeaning classification を行うことである.セマンティックインデクシングは、meaning にbased づいた高な影検SO への応用 がlook forward to される research The subject is the same as the subject, the image, the sound, and the speech.さらに, large-scale processing of なデータのにけて, high-speed なspecial extraction of アルゴリズムがである.そこで, this year は, Neighbor-to-Neighbor (NTN) explores という high-speed technology and を新たに开発した. NTN exploration, quantization, hybrid distribution, accuracy calculation, high-speed calculation, input powerなる特徴quantityの中からsimilarityしたものをExplorationし、similarityに応じてcalculationをomitすることでspeed-upを実appearする. PASCAL VOC video clips Mixed distribution is used to create a blended distributionングシステムにNTN exploration and importing are done, the accuracy is high and the state is maintained, and the calculation amount is reduced by 89.3%.また、image analysisに关する国际ワークショップであるTRECVIDのセマンティックインデクシングタスクにおける Comments価実験では, 6 types of images and audio features とこParticipate in 18 machines with the れまでに开発したtechniqueをintegrationして Use いることで, image 検出 precision がタスクThe 3rd place in Kanaka is Naru, the precision and calculation amount are the same, and the usefulness of my technique is confirmed.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Neighbor-to-Neighbor Search for Fast Coding of Feature Vectors
- DOI:10.1109/iccv.2013.156
- 发表时间:2013-12
- 期刊:
- 影响因子:0
- 作者:Nakamasa Inoue;K. Shinoda
- 通讯作者:Nakamasa Inoue;K. Shinoda
TokyoTech+Canon at TRECVID 2011 Semantic Indexing Using GMM Supervectors and Tree-structured GMMs
TokyoTech Canon 在 TRECVID 2011 使用 GMM 超向量和树结构 GMM 进行语义索引
- DOI:
- 发表时间:2011
- 期刊:
- 影响因子:0
- 作者:井上 中順;篠田 浩一;井上中順;井上中順
- 通讯作者:井上中順
q-Gaussian mixture models for image and video semantic indexing
- DOI:10.1016/j.jvcir.2013.10.005
- 发表时间:2013-11
- 期刊:
- 影响因子:0
- 作者:Nakamasa Inoue;Koichi Shinoda
- 通讯作者:Nakamasa Inoue;Koichi Shinoda
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
井上 中順其他文献
Reaparicion de la meliponicultura y su identidad maya
玛雅文化的再现和玛雅人的认同
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
井上 中順;篠田 浩一;井上中順;井上中順;井堂彰人 - 通讯作者:
井堂彰人
口唇の深度画像を用いたディープオートエンコーダによるマルチモーダル音声認識
使用唇部深度图像的深度自动编码器进行多模态语音识别
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
安井勇樹;岩野 公司;井上 中順;篠田 浩一 - 通讯作者:
篠田 浩一
口唇深度画像を利用したディープオートエンコーダに基づくマルチモーダル音声認識
基于唇部深度图像的深度自动编码器的多模态语音识别
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
安井 勇樹;岩野 公司;井上 中順;篠田 浩一 - 通讯作者:
篠田 浩一
井上 中順的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('井上 中順', 18)}}的其他基金
深層学習モデルの分解と再構成による認識原理の解明と学習効率化
通过分解重构深度学习模型,阐明识别原理,提高学习效率
- 批准号:
22K12089 - 财政年份:2022
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Towards an Algebra for Distributed Deep Neural Networks
分布式深度神经网络的代数
- 批准号:
19K22865 - 财政年份:2019
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
連動型学習を用いた複数センサからの行動のモデル化と行動をクエリとした検索
使用链接学习对来自多个传感器的行为进行建模,并使用行为作为查询进行搜索
- 批准号:
26880006 - 财政年份:2014
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Research Activity Start-up
相似海外基金
Effective image search and retrieval through automatic image annotation
通过自动图像注释进行有效的图像搜索和检索
- 批准号:
DP130100024 - 财政年份:2013
- 资助金额:
$ 1.22万 - 项目类别:
Discovery Projects
Computer Vision as a Service (CaaS): Cloud based Virtual Fitting and Fashion Image search Engine API
计算机视觉即服务 (CaaS):基于云的虚拟试衣和时尚图像搜索引擎 API
- 批准号:
720211 - 财政年份:2013
- 资助金额:
$ 1.22万 - 项目类别:
GRD Development of Prototype
Development of a new image search system based on similarity measures and ranking
开发基于相似性度量和排序的新图像搜索系统
- 批准号:
24500126 - 财政年份:2012
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
High Performance and Versatile Image Search Scheme by Statistics of Pixel Value and Digital Image Watermark Method Resistant to Average Attack
高性能、多功能的像素值统计图像搜索方案和抗平均攻击的数字图像水印方法
- 批准号:
24560466 - 财政年份:2012
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Large scale medical image search technology - a proof of concept
大规模医学图像搜索技术——概念验证
- 批准号:
710227 - 财政年份:2012
- 资助金额:
$ 1.22万 - 项目类别:
GRD Proof of Concept
Image search for simulator content creation
用于模拟器内容创建的图像搜索
- 批准号:
LP100100791 - 财政年份:2011
- 资助金额:
$ 1.22万 - 项目类别:
Linkage Projects
Grid-Based Query Creation for Interactive Image Search
用于交互式图像搜索的基于网格的查询创建
- 批准号:
22700093 - 财政年份:2010
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
EAGER: Large Scale Partial-duplicate Image Search by Post Verification of Local Feature Matching
EAGER:通过局部特征匹配后验证进行大规模部分重复图像搜索
- 批准号:
1052851 - 财政年份:2010
- 资助金额:
$ 1.22万 - 项目类别:
Standard Grant
映像特徴と検索履歴に基づく映像検索に関する研究
基于视频特征和搜索历史的视频搜索研究
- 批准号:
10J55022 - 财政年份:2010
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for JSPS Fellows
EAGER: Grouping Features for Object Localization and Image Search
EAGER:对象定位和图像搜索的分组功能
- 批准号:
0951754 - 财政年份:2009
- 资助金额:
$ 1.22万 - 项目类别:
Standard Grant