大規模マルチメディアコーパスによる映像合成に関する研究
基于大规模多媒体语料库的视频合成研究
基本信息
- 批准号:12F02712
- 负责人:
- 金额:$ 1.47万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2012
- 资助国家:日本
- 起止时间:2012 至 2013
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では、自然言語によるシナリオ記述の入力を行い、実際の映像を自動生成する技術の実現を目的とする。本技術により、テキスト情報をより人間に理解しやすい映像へ自動変換するシステム、映像制作者を対象とした簡易版映像の自動生成等の新たな応用の実現が期待できる。また、現在テキストと映像などの視覚情報との間のセマンティックギャップにより映像意味解析や検索などがきわめて困難となっているが、本研究による新たな見方からセマンティックギャップをとらえなおすことにより、セマンティックギャップ克服のためのブレークスルーにつながる可能性が考えられる。本研究では、インターネットや放送映像アーカイブなどから得られる大量の映像コーパスに基づき、テキストからの映像自動生成の実現を目指す。そのため、平成24年度は、大量の映像コーパスから、物体、動作、イベントなどに基づく事例映像データベースの構築を行うための技術について検討した。特に、実際の映像アーカイブ(TRECVIDコンテンツ並びに独自にインターネットより取得した映像)を対象とし、映像中の動作を行っている事物を自動的に高速に抽出し、部品化する技術について検討した。これにより、世界最先端の手法とほぼ同等の品質ながら、きわめて高速な技術を実現した。平成25年度は、これまでの成果を特段に拡張した映像マイニング技術についての検討を開始しており、大量の映像アーカイブ中に頻出する事物を自動検出することにより、さらに品質の高い映像部品化について検討した。本技術により、映像自動生成のために有用な情報も抽出可能な映像部品化が実現できる。
This study で は, natural speech に よ る シ ナ リ オ account の を line い into force, the event be の image を automatically generated す る technology の purpose be presently を と す る. This technical に よ り, テ キ ス ト intelligence を よ り に understand human し や す い image へ automatic variations in す る シ ス テ ム and producer of image を like と seaborne し た simple image の automatically generate new の た な 応 with の be が now expect で き る. ま た, now テ キ ス ト と image な ど の apparent 覚 intelligence と の between の セ マ ン テ ィ ッ ク ギ ャ ッ プ に よ り image mean parsing や 検 cable な ど が き わ め て difficult と な っ て い る が, this study に よ る new た な square か ら セ マ ン テ ィ ッ ク ギ ャ ッ プ を と ら え な お す こ と に よ り, セ マ ン テ ィ ッ ク ギ ャ ッ プ overcome の た め の ブ レ ー Youdaoplaceholder0 ス ス に に ながる ながる ながる possibility が test えられる. This study で は, イ ン タ ー ネ ッ ト や hoso image ア ー カ イ ブ な ど か ら have ら れ る large の image コ ー パ ス に base づ き, テ キ ス ト か ら の image automatically generated の be presently を refers す. そ の た め, pp.47-53 24 year は, massive の image コ ー パ ス か ら, objects, actions, イ ベ ン ト な ど に base づ く example image デ ー タ ベ ー ス の line build を う た め の technology に つ い て beg し 検 た. に, be interstate の image ア ー カ イ ブ (TRECVID コ ン テ ン ツ and び に に alone イ ン タ ー ネ ッ ト よ り obtain し た image) を like と seaborne し, image の action line を っ て い る things を automatic high-speed に に drew し, part す る technology に つ い て beg し 検 た. The world 's most advanced <s:1> techniques とほぼ are of the same quality ながら, and <s:1> わめて high-speed な technology を is realized in た. 25 year は pp.47-53, こ れ ま で を の achievements, period of に company, zhang し た image マ イ ニ ン グ technology に つ い て の を 検 please start し て お り, massive の image ア ー カ イ ブ に in mount す る を automatic 検 things out す る こ と に よ り, さ ら に quality の high い image part に つ い て beg し 検 た. This technology によ によ, automatic image generation ために ために useful な intelligence <e:1> extraction possible な image componentization が actual occurrence で る る.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
VabCut: A video extension of GrabCut for unsupervised video foreground object segmentation
VabCut:GrabCut 的视频扩展,用于无监督视频前景对象分割
- DOI:10.5220/0004677103620371
- 发表时间:2015
- 期刊:
- 影响因子:0
- 作者:Sébastien Poullot;S. Satoh
- 通讯作者:S. Satoh
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
佐藤 真一其他文献
コンピュータ強化キッチンによるインタラクティブ調理支援
通过计算机增强厨房提供交互式烹饪支持
- DOI:
- 发表时间:
2005 - 期刊:
- 影响因子:0
- 作者:
浜田 玲子;宮澤 寛;鈴木幸敏;岡部 淳;佐藤 真一;坂井 修一;椎尾 一郎 - 通讯作者:
椎尾 一郎
Boosting Image Retrieval by Diffusion
通过扩散增强图像检索
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
河江肖剰;佐藤悦夫;佐藤昇;高橋亮介その他;渡辺美季;李成市;阿部芳弘・日下宗一郎・米田穣ほか;清水哲郎;高田智和;佐藤宏之;佐藤 真一;山花京子;高田智和;グエン・ティ・フォン・トム;小関悠一郎;会田薫子;高橋龍三郎;山田康弘;Shin'ichi Satoh - 通讯作者:
Shin'ichi Satoh
ALD法で成膜したAlOxパッシベーションのバンド構造評価
ALD法形成的AlOx钝化膜的能带结构评价
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
池野 成裕,山下 祥弘;陰地 宏;三木 祥平;新船 幸二; 吉田 晴彦;佐藤 真一;廣沢 一郎;知京 豊裕;小椋 厚志 - 通讯作者:
小椋 厚志
大容量放送映像アーカイブからの同一フラッシュシーン映像の発見
从大容量广播视频档案中发现相同的Flash场景视频
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
瀧本 政雄;佐藤 真一;坂内 正夫 - 通讯作者:
坂内 正夫
佐藤 真一的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('佐藤 真一', 18)}}的其他基金
Provable, Explainable, Efficient, Robust Deep Neural Network for Large-scale Multimedia Retrieval
用于大规模多媒体检索的可证明、可解释、高效、鲁棒的深度神经网络
- 批准号:
22KF0369 - 财政年份:2023
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for JSPS Fellows
Construction of metric space for datasets and learning algorithms
数据集和学习算法的度量空间构建
- 批准号:
22H03620 - 财政年份:2022
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
証明可能・説明可能・効率的・頑健な深層学習と大規模マルチメディア検索への応用
可证明、可解释、高效、鲁棒的深度学习及其在大规模多媒体搜索中的应用
- 批准号:
21F20377 - 财政年份:2021
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for JSPS Fellows
証明可能・説明可能・効率的・頑健な深層学習と大規模マルチメディア検索への応用
可证明、可解释、高效、鲁棒的深度学习及其在大规模多媒体搜索中的应用
- 批准号:
21F40377 - 财政年份:2021
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for JSPS Fellows
証明可能・説明可能・効率的・頑健な深層学習と大規模マルチメディア検索への応用
可证明、可解释、高效、鲁棒的深度学习及其在大规模多媒体搜索中的应用
- 批准号:
20F20377 - 财政年份:2020
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for JSPS Fellows
Known Re-identification, Unknown Detection, and Their Behavior Discovery
已知的重识别、未知的检测及其行为发现
- 批准号:
18F18378 - 财政年份:2018
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for JSPS Fellows
大規模マルチモーダルアーカイブの視覚情報に基づく解析
基于可视化信息的大规模多模式档案分析
- 批准号:
15F14773 - 财政年份:2015
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for JSPS Fellows
画像意味理解のためのクラスタリングによる特徴抽出
通过聚类提取特征以理解图像含义
- 批准号:
20650025 - 财政年份:2008
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Exploratory Research
視覚情報とテキスト情報とを統合した映像検索のための映像シソーラスの構築
构建集成视觉和文本信息的视频搜索视频词库
- 批准号:
16016289 - 财政年份:2004
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
視覚情報とテキスト情報とを統合した映像検索のための映像シソーラスの構築
构建集成视觉和文本信息的视频搜索视频词库
- 批准号:
15017285 - 财政年份:2003
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
相似海外基金
深層学習を用いたドライブレコーダの映像解析による危険動作の自動検出
使用深度学习对行车记录仪进行视频分析,自动检测危险动作
- 批准号:
24K07963 - 财政年份:2024
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
手術鉗子動態・映像解析を用いた腹腔鏡手術熟練者の技術の言語化と手術教育への利用
使用手术钳动力学和视频分析对腹腔镜手术专家的技术进行语言化描述并用于外科教育
- 批准号:
24K00443 - 财政年份:2024
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
多波長映像解析に基づく非接触型生命兆候計測
基于多波长视频分析的非接触式生命体征测量
- 批准号:
22K12080 - 财政年份:2022
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
遠隔映像解析における検出精度と遅延要件を満足する適応的映像品質制御に関する研究
满足远程视频分析中检测精度和延迟要求的自适应视频质量控制研究
- 批准号:
21K21293 - 财政年份:2021
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Research Activity Start-up
Deep Learning Architecture with Context Adaptive Features for Image Parsing
用于图像解析的具有上下文自适应特征的深度学习架构
- 批准号:
DP200102252 - 财政年份:2020
- 资助金额:
$ 1.47万 - 项目类别:
Discovery Projects
防犯カメラ人物映像解析:歩行・走行・自転車運転人物の認証・認識技術開発
安防摄像头人物视频分析:开发人物步行、跑步、骑行的认证和识别技术
- 批准号:
20H04188 - 财政年份:2020
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
CAREER: Holistic 3D Brain Image Parsing by Integrating Implicit and Explicit Models
职业:通过集成隐式和显式模型进行整体 3D 大脑图像解析
- 批准号:
1360568 - 财政年份:2013
- 资助金额:
$ 1.47万 - 项目类别:
Continuing Grant
CAREER: Non-Parametric Image Parsing
职业:非参数图像解析
- 批准号:
1149633 - 财政年份:2012
- 资助金额:
$ 1.47万 - 项目类别:
Continuing Grant
CAREER: Deep sparse dictionary context models and their application to image parsing and neuron tracking for connectomics
职业:深度稀疏字典上下文模型及其在连接组学图像解析和神经元跟踪中的应用
- 批准号:
1149299 - 财政年份:2012
- 资助金额:
$ 1.47万 - 项目类别:
Standard Grant
映像の意味理解を実現する映像解析手法の確立とその応用に関する研究
实现视频意义理解的视频分析方法建立及其应用研究
- 批准号:
11J01938 - 财政年份:2011
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for JSPS Fellows