A research for automatic structure extraction and information retrieval from video data using speech and voice
使用语音和语音从视频数据中自动结构提取和信息检索的研究
基本信息
- 批准号:17500073
- 负责人:
- 金额:$ 2.41万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2005
- 资助国家:日本
- 起止时间:2005 至 2007
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The first theme of this research is to realize an automatic video segmentation. For this purpose,we developed the methods for extracting a local and global feature of video information and for classifying video data sets. The second theme is automatic extraction of the structure for segmented video data sets using local and global similarity and dissimilarity between the segmented sections. This research first conducted the analysis of local acoustic and image similarity in video data sets,and extracted similar partial sections that are repeated in a music piece. The developed method then discriminated speech sections and music sections respectively using a local feature and a global feature.We confirmed the developed methods worked well for real video data sets. The research also conducted speech retrieval by a text and speech query for speech video sections segmented by the above method. For speech retrieval,new technique of dealing with any words for a query and the integration method for plural subword models were proposed,and the experimental results demonstrated the method showed better performance compared to former methods. These results were reported at the many domestic and international conferences. In the future,we are going to develop the methods for the actual use.
本研究的第一个主题是实现自动视频分割。为此,我们开发了提取视频信息的局部和全局特征以及对视频数据集进行分类的方法。第二个主题是使用分段部分之间的局部和全局相似性和相异性自动提取分段视频数据集的结构。本研究首先对视频数据集中的局部声学和图像相似度进行分析,提取音乐作品中重复的相似部分片段。然后,所开发的方法分别使用局部特征和全局特征来区分语音部分和音乐部分。我们证实所开发的方法对于真实视频数据集效果良好。该研究还针对上述方法分割的语音视频片段,通过文本和语音查询进行语音检索。针对语音检索,提出了处理查询任意词的新技术和复数子词模型的集成方法,实验结果表明该方法比以前的方法表现出更好的性能。这些成果在许多国内外会议上都有报道。未来,我们将开发实际使用的方法。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
音声検索システムのための時間整合を考慮したサブワードモデル構築手法の検討
考虑时间对齐的语音搜索系统子词模型构建方法研究
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:岩田耕平;伊藤慶明;小嶋和徳;石亀昌明;田中和世;李時旭
- 通讯作者:李時旭
Shift Continuous DP: A Fast Matching Algorithm between Arbitrary Parts of Two Time-Sequence Data Sets
Shift Continuous DP:两个时序数据集任意部分的快速匹配算法
- DOI:
- 发表时间:2005
- 期刊:
- 影响因子:0
- 作者:H.Fujiwara;K.Sato;K.Fujii;M.Morimoto;Yoshiaki Itoh
- 通讯作者:Yoshiaki Itoh
語彙フリー音声検索におけるサブワードの検討および災害放送検索システムへの応用
无词汇语音搜索子词研究及其在灾害广播搜索系统中的应用
- DOI:
- 发表时间:2005
- 期刊:
- 影响因子:0
- 作者:岩田耕平;伊藤慶明;小嶋和徳;石亀昌明;田中和世;李時旭
- 通讯作者:李時旭
Knowledge integration in annotation-based collaborative virtual environments
基于注释的协作虚拟环境中的知识集成
- DOI:
- 发表时间:2005
- 期刊:
- 影响因子:0
- 作者:S.Aubry;S.Okawa;D.Lenne;I.Thouvenin
- 通讯作者:I.Thouvenin
語彙非依存型音声文書検索のためのサブワードモデルおよび検索方式の検討
与词汇无关的口语文档检索的子词模型和搜索方法研究
- DOI:
- 发表时间:2007
- 期刊:
- 影响因子:0
- 作者:岩田 耕平;伊藤 慶明;小嶋 和徳;石亀 昌明;田中 和世;Shi-wook Lee
- 通讯作者:Shi-wook Lee
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
ITOH Yoshiaki其他文献
ITOH Yoshiaki的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('ITOH Yoshiaki', 18)}}的其他基金
Tissue engineered blood vessel sheet to prevent cerebral infarction
组织工程血管片预防脑梗塞
- 批准号:
23591281 - 财政年份:2011
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Random sequential packing of cubes into torus
将立方体随机顺序打包成环面
- 批准号:
23540177 - 财政年份:2011
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
A Stochastic Construction of Golay Code
格雷码的随机构造
- 批准号:
02640194 - 财政年份:1990
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
Statistical Destribution on Symmetry Groups
对称群的统计分布
- 批准号:
61540171 - 财政年份:1986
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
相似海外基金
Sharing Developmental, Meta, and Video Data from Preterm Infants Enrolled in the SPEEDI Clinical Trial
共享参加 SPEEDI 临床试验的早产儿的发育、元数据和视频数据
- 批准号:
10789838 - 财政年份:2023
- 资助金额:
$ 2.41万 - 项目类别:
Using "bear's-eye view" video data to estimate black bear kill rates of boreal caribou calves and the resulting effect on caribou population dynamics
使用“熊眼视图”视频数据来估计北方驯鹿幼崽的黑熊死亡率及其对驯鹿种群动态的影响
- 批准号:
576068-2022 - 财政年份:2022
- 资助金额:
$ 2.41万 - 项目类别:
Alexander Graham Bell Canada Graduate Scholarships - Master's
Intelligent traffic monitoring using video data mining
使用视频数据挖掘的智能交通监控
- 批准号:
566707-2021 - 财政年份:2021
- 资助金额:
$ 2.41万 - 项目类别:
Alliance Grants
EAGER: SaTC: SAVED: Secure Audio and Video Data from Deepfake Attacks Leveraging Environmental Fingerprints
EAGER:SaTC:SAVED:利用环境指纹保护音频和视频数据免遭 Deepfake 攻击
- 批准号:
2039342 - 财政年份:2020
- 资助金额:
$ 2.41万 - 项目类别:
Standard Grant
EAGER: Model-Free Classification of Collective Behavior Based on Automated Detection of Symmetry from Video Data
EAGER:基于视频数据对称性自动检测的集体行为的无模型分类
- 批准号:
1708622 - 财政年份:2017
- 资助金额:
$ 2.41万 - 项目类别:
Standard Grant
EAGER: Joint Modeling and Querying of Social Media and Video Data
EAGER:社交媒体和视频数据的联合建模和查询
- 批准号:
1746031 - 财政年份:2017
- 资助金额:
$ 2.41万 - 项目类别:
Standard Grant
ABI Sustaining: Maintenance of the XMA/ZMAPortal video data management systems and XMALab video motion analysis software for the comparative biomechanics community
ABI Sustaining:为比较生物力学界维护 XMA/ZMAPortal 视频数据管理系统和 XMALab 视频运动分析软件
- 批准号:
1661129 - 财政年份:2017
- 资助金额:
$ 2.41万 - 项目类别:
Standard Grant
COVMAP-2: Continuation of Comprehensive Conjoint GPS, Sensor and Video Data Analysisfor Next Generation of Smart Maps
COVMAP-2:下一代智能地图的综合联合 GPS、传感器和视频数据分析的延续
- 批准号:
314236227 - 财政年份:2016
- 资助金额:
$ 2.41万 - 项目类别:
Priority Programmes
Hierarchical models for the recognition of human activities in video data
用于识别视频数据中人类活动的分层模型
- 批准号:
311269674 - 财政年份:2016
- 资助金额:
$ 2.41万 - 项目类别:
Research Grants
Development of crash prediction models based on surrogate safety measures extracted from video data
基于从视频数据中提取的替代安全措施开发碰撞预测模型
- 批准号:
505284-2016 - 财政年份:2016
- 资助金额:
$ 2.41万 - 项目类别:
Engage Grants Program














{{item.name}}会员




