面向网络信息安全的图像视频中的文字语义理解理论与方法
项目介绍
AI项目解读
基本信息
- 批准号:61733007
- 项目类别:重点项目
- 资助金额:270.0万
- 负责人:
- 依托单位:
- 学科分类:F0304.系统工程理论与技术
- 结题年份:2022
- 批准年份:2017
- 项目状态:已结题
- 起止时间:2018-01-01 至2022-12-31
- 项目参与者:白翔; 殷飞; 王蕊; 杨欣; 王兴刚; 张华; 郭园方; 李弼; 唐芃;
- 关键词:
项目摘要
Text understanding has wide applications in network information security, human-computer interaction, and intelligent transportation, etc. Due to scene complexity, text diversity, and semantic latency, the performance of existing techniques for text detection and recognition in images/videos is not satisfactory which significantly limits their applications. This project aims at text understanding in images/videos for cyberspace content security by introducing a series of innovative, general, and effective methods for multi-language text detection, recognition, and understanding. Specifically, this project plans to 1) propose multi-language text representation model and general purpose representation transfer method; 2) address multi-language text detection and recognition under few-shot setting by systematically combining generative structure learning and discriminative statistical learning; 3) propose multimodal latent semantic perception methods based on images, videos and text, which achieves images/videos content aided relevance fusion analysis and address the bottleneck problem in sensitive images/videos identification and filtering. In the end, this proposal will 1) present methods which substantially improve the performance of text detection and recognition; 2) distribute a large-scale multi-language text dataset containing approximately100,000 images and organize text understanding related contests and competitions; 3) develop two prototype systems for sensitive text retrieval and illegal content monitoring respectively.
文本语义理解在网络信息安全、人机交互、智能交通等领域具有广阔的应用前景。由于技术和性能的限制,图像视频文本识别和理解距实用还有很大差距,原因在于场景复杂性、文本形式多样性以及语义隐藏性。本项目研究面向网络信息安全的图像视频文字语义理解理论与方法,提出一系列创新的、通用的、有效的多语言文本检测和识别、语义理解方法,包括跨语种通用多语言文本特征表示模型及通用特征的高效迁移方法,将生成式结构学习和区分式统计学习有机结合,解决小样本下的多语言文字检测和识别问题;提出图像视频与文本识别的多模态协同感知隐含语义的方法,实现图像视频内容辅助的关联融合分析,解决面向网络信息安全的敏感图像视频自动鉴别和过滤中的瓶颈问题。实质性地提高多语言文本检测和识别的性能;发布一个10万幅图规模、面向网络空间内容安全的多语言文本图像视频语义理解数据库并组织相关的竞赛;研发敏感词检索、敏感内容检测两个应用示范原型系统。
结项摘要
随着移动终端及互联网技术的不断发展,网络上图像与视频等媒体数据呈指数级增长。然而,部分媒体内容散布敏感言论、虚假信息等,给国家安全、社会稳定、群众生活带来了极大的危害。文本语义理解在网络信息安全、人机交互、智能交通等领域具有广阔的应用前景。由于技术和性能的限制,图像视频文本识别和理解距实用还有很大差距,原因在于场景复杂性、文本形式多样性以及语义隐藏性。本项目研究面向网络信息安全的图像视频文字语义理解理论与方法,在通用文本快速检测、语种鉴别、多语言文本识别、视频文本的跟踪与识别、图像视频中文本信息的融合理解等方面提出一系列创新、有效的模型和方法。本项目提出基于角点的文字检测方法,只需要一个局部感受野便可检测多方向、长文本,解决任意方向文字检测的难题。针对文本检测复杂度过高的问题,提出可微分的二值化操作,显著提升了文本检测算法的推理效率。提出了结合空间变换网络与注意力机制的文字识别方法,解决低质量文字中存在注意力漂移的问题和不规则文本的识别准确率低的问题,准确率超出当时最好方法10%。首次提出端到端的场景文字检测与识别算法。针对神经网络感受野大小与网络复杂度的矛盾,提出了一种新颖的循环十字型注意力机制,采用高效的十字形注意力机制替代全局注意力机制增强特征的上下文信息,并且大幅度降低了注意力机制的计算开销。提出了基于人类认知过程的多模态信息深度认知子空间聚类学习方法。通过赋予每个样本权重并动态评估样本的难易程度来更新权重,提高了聚类模型的鲁棒性。.项目研发的场景图像文字检测与识别技术搭载华为P40高端手机作为其标配的文字检测算法;开发的多语种文字图像舆情分析系统应用于公安部第三研究所等单位,提升了反恐应急响应能力;场景图像文字检测算法DBNet++应用于微信8.0版的图片文字提取功能。提出图像视频与文本识别的多模态协同感知隐含语义的方法,实现图像视频内容辅助的关联融合分析,解决面向网络信息安全的敏感图像视频自动鉴别和过滤中的瓶颈问题,研发了敏感词检索、敏感内容检测两个应用示范系统。
项目成果
期刊论文数量(39)
专著数量(0)
科研奖励数量(2)
会议论文数量(72)
专利数量(17)
Generalized Latent Multi-View Subspace Clustering
广义潜在多视图子空间聚类
- DOI:10.1109/tpami.2018.2877660
- 发表时间:2020-01
- 期刊:IEEE Transactions on Pattern Analysis and Machine Intelligence
- 影响因子:23.6
- 作者:Changqing Zhang;Huazhu Fu;Qinghua Hu;Xiaochun Cao;Yuan Xie;Dacheng Tao;Dong Xu
- 通讯作者:Dong Xu
DiffNet: A Learning to Compare Deep Network for Product Recognition
DiffNet:学习比较深度网络进行产品识别
- DOI:10.1109/access.2020.2967090
- 发表时间:2020
- 期刊:IEEE ACCESS
- 影响因子:3.9
- 作者:Hu Bin;Zhou Nuoya;Zhou Qiang;Wang Xinggang;Liu Wenyu
- 通讯作者:Liu Wenyu
AlignSeg: Feature-Aligned Segmentation Networks
Alignseg:特征对齐的分割网络
- DOI:10.1109/tpami.2021.3062772
- 发表时间:2022-01-01
- 期刊:IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE
- 影响因子:23.6
- 作者:Huang, Zilong;Wei, Yunchao;Shi, Humphrey
- 通讯作者:Shi, Humphrey
FairMOT: On the Fairness of Detection and Re-identification in Multiple Object Tracking
FairMOT:论多目标跟踪中检测和重识别的公平性
- DOI:10.1007/s11263-021-01513-4
- 发表时间:2021-09-03
- 期刊:INTERNATIONAL JOURNAL OF COMPUTER VISION
- 影响因子:19.5
- 作者:Zhang, Yifu;Wang, Chunyu;Liu, Wenyu
- 通讯作者:Liu, Wenyu
Boundary TextSpotter: Toward Arbitrary-Shaped Scene Text Spotting
Boundary TextSpotter:实现任意形状的场景文本识别
- DOI:10.1109/tip.2022.3206615
- 发表时间:2022-09
- 期刊:IEEE transactions on image processing
- 影响因子:10.6
- 作者:Pu Lu;Hao Wang;Shenggao Zhu;Jing Wang;Xiang Bai;Wenyu Liu
- 通讯作者:Wenyu Liu
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
一种基于动态跳数距离的有洞无线传感器网络定位方法
- DOI:--
- 发表时间:--
- 期刊:计算机科学
- 影响因子:--
- 作者:张松涛;蒋洪波;刘文予
- 通讯作者:刘文予
曲线曲面的形态算法及应用
- DOI:--
- 发表时间:--
- 期刊:计算机学报
- 影响因子:--
- 作者:刘文予;朱学喜
- 通讯作者:朱学喜
面向体验质量的多媒体计算通信
- DOI:10.11834/jig.200864
- 发表时间:2021
- 期刊:中国图象图形学报
- 影响因子:--
- 作者:陶晓明;杨铀;徐迈;段一平;黄丹蓝;刘文予
- 通讯作者:刘文予
基于多尺度三元组描述子的形状匹配方法
- DOI:--
- 发表时间:--
- 期刊:华中科技大学学报(自然科学版)
- 影响因子:--
- 作者:刘文予;王军伟
- 通讯作者:王军伟
一种基于识别函数的多尺度骨架算法
- DOI:--
- 发表时间:--
- 期刊:外与毫米波学报, 已投稿
- 影响因子:--
- 作者:郑宇化;刘文予
- 通讯作者:刘文予
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
刘文予的其他基金
高效可泛化动态神经场表征理论及应用
- 批准号:62376102
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
显著视觉相似性度量模型及应用
- 批准号:61572207
- 批准年份:2015
- 资助金额:67.0 万元
- 项目类别:面上项目
数据集多尺度特征提取与表达的视觉凹度方法
- 批准号:61173120
- 批准年份:2011
- 资助金额:56.0 万元
- 项目类别:面上项目
广义凸分解理论及应用
- 批准号:60873127
- 批准年份:2008
- 资助金额:33.0 万元
- 项目类别:面上项目
无线移动环境下复杂度可分级联合功率率失真模型
- 批准号:60572063
- 批准年份:2005
- 资助金额:23.0 万元
- 项目类别:面上项目
无线信道下的信道广义率失真模型研究
- 批准号:60372067
- 批准年份:2003
- 资助金额:6.0 万元
- 项目类别:面上项目
基于广义条件骨架的三维图形识别新方法研究
- 批准号:60273099
- 批准年份:2002
- 资助金额:7.0 万元
- 项目类别:面上项目
基于形态学的非刚体运动及变形的新方法研究
- 批准号:69973018
- 批准年份:1999
- 资助金额:13.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}