课题基金基金详情
基于多示例学习和半监督学习的手势语识别的研究
结题报告
批准号:
61303170
项目类别:
青年科学基金项目
资助金额:
22.0 万元
负责人:
周宇
学科分类:
F0210.计算机图像视频处理与多媒体技术
结题年份:
2016
批准年份:
2013
项目状态:
已结题
项目参与者:
庹宇鹏、葛瑞海、乔延臣、邹庆欣、庞依、徐小程、王亚如、孙芳、徐翔
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
客服二维码
微信扫码咨询
中文摘要
手势语识别是模式识别和智能人机交互领域的研究热点,具有重要的理论意义和应用价值。基于视觉的手势语识别中,在复杂动态背景、视角变换和用户变换情况下其系统性能下降明显,已成为阻碍手势语识别研究发展的瓶颈问题;同时手势语的多模态特性也未能受到足够重视;本项目在以往相关研究的基础上对这些问题逐一进行研究。针对复杂动态背景下的手势语识别问题,研究基于多示例学习框架的手势语识别方法,以确保系统在手部区域定位和跟踪失准时仍能正常识别;针对手势语的多模态特性,充分利用手部信息以外的唇动、表情、头势等信息,研究基于多模态的多示例学习方法;针对视角变换和用户变换情况,采用半监督学习机制,利用大量无标注数据更新模型参数,来提高系统的可移植性。
英文摘要
Sign language recognition is a research focus in the pattern recognition and the intelligent human-computer interaction fields, and is of great theoretical significance and practical value. For vision based sign language recognition, the performance decreases obviousely in the case of cluttered dynamic backgrounds, view and signer variances, which limits the progress of sign language recognition research. At the same time, the multimodal characteristic of sign language is not mined sufficiently in the previous research. This project aims to solve these problems. To solve the problem of recognition in the clutteredd dynamic backgrounds, we introduce the multi-instance learning to sign language recognition, which can recognize gestures even when the hands are not well located and tracked. For multimodal sign lanuage recognition, we add the lip movement, facial expression and head pose information to the multimodal multi-instance framework. To recognize sign language in the cases of view variance and signer variance, we use large amount of unlabeled data to tailor the parameters of the models with the scheme of semi-supervised learning.
基于流形学习、度量学习、低秩估计、字典学习、交叉验证等方法,解决手势手语识别中的多视角问题、自适应问题、快速识别问题、非特定人识别问题等;项目组成员共发表高水平论文14篇,申请发明专利7项,参加国际会议2次,参加国内会议2次。依托于项目的核心技术,项目组开发了钓鱼网站检测系统和场景图像文字检测识别系统,前者应用于工信部安全中心,后者应用于中央网信办。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
A Semantics-Aware Approach to the Automated Network Protocol Identification
一种语义感知的网络协议自动识别方法
DOI:10.1109/tnet.2014.2381230
发表时间:2016-02
期刊:IEEE/ACM TRANSACTIONS ON NETWORKING
影响因子:--
作者:云晓春;王一鹏;张永铮;周宇
通讯作者:周宇
Unsupervised adaptive sign language recognition based on hypothesis comparison guided cross validation and linguistic prior filtering
基于假设比较引导交叉验证和语言先验过滤的无监督自适应手语识别
DOI:10.1016/j.neucom.2014.08.032
发表时间:2015-02
期刊:Neurocomputing
影响因子:6
作者:Xiaokang Yang;Yongzheng Zhang;Xiang Xu;Yipeng Wang
通讯作者:Yipeng Wang
Summarizing surveillance videos with local-patch-learning-based abnormality detection, blob sequence optimization, and type-based synopsis
通过基于局部补丁学习的异常检测、斑点序列优化和基于类型的概要来总结监控视频
DOI:10.1016/j.neucom.2014.12.044
发表时间:2015-05-01
期刊:NEUROCOMPUTING
影响因子:6
作者:Lin, Weiyao;Zhang, Yihao;Zhou, Yu
通讯作者:Zhou, Yu
视觉与语义融合的场景文字检测与识别技术研究
国内基金
海外基金