面向敏感网络图像过滤的原生数字图像文本提取关键技术研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61201424
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    24.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0113.信息获取与处理
  • 结题年份:
    2015
  • 批准年份:
    2012
  • 项目状态:
    已结题
  • 起止时间:
    2013-01-01 至2015-12-31

项目摘要

Born-digital images are generated directly on the computer. Harmful text transmitted online is easily converted into born-digital images to avoid text-based filtering. In previous studies on text extraction from complex images, component connector-based methods have been widely used. However, it is a difficult task for born-digital images to generate component connectors because born-digital images are inherently low-resolution for online transfer and often suffer from anti-aliasing. To solve this problem, a hierarchical optimization model, that allows integration of features computed at different levels of the quantization hierarchy, will be set up in this study. Parameters of the model will be automatically estimated by supervised training. To reduce the computational time for solving the hierarchical model, superpixels, that generated by over-segmentation of color images, will be considered as an alternative for pixels. Furthermore, techniques of using multiple segmentations or soft decision will be applied during over-segmentation to ensure that superpixels align well with the boundary of characters. Aiming at the application of content-based web image filtering, predefined keywords will be integrated into the hierarchical model, so that the images embedded with harmful text can be detected with high recall rate.
原生数字图像是用计算机软件生成的图像。不良文本信息可以很容易地转为原生数字图像在网络传播,从而避过文本过滤技术。原生数字图像文本提取工作面临分辨率低、边缘柔化所引起的连通体生成困难这一问题,使得以往复杂图像文本提取研究中常用的基于连通体分析的方法失效。本课题拟构建多级优化模型,通过像素点级、连通体级、文字级的同步优化解决连通体生成困难问题;采用基于样本库的自适应学习解决优化模型的参数选取问题;利用彩色图像过分割等方法解决模型求解效率问题,并基于过分割结果融合及软决策方式解决超像素边界与文字边界的匹配问题。针对敏感网络图像过滤应用,将敏感关键词信息融入到优化模型中,以高召回率检测敏感图像,解决不良文本内容以图像方式在网络传播所带来的社会问题。

结项摘要

原生数字图像是用计算机软件生成的图像。不良文本信息可以很容易地转为原生数字图像在网络传播,从而避过文本过滤技术。本项目中,我们将复杂图像文本提取过程分为如下三个步骤:文本区域提取、文字分割和文字识别。针对提取过程的每一个步骤,本项目进行了如下研究:第一,基于滑动窗口利用纹理特征进行文本块的判别,并按预定义的规则将多个文本块合并为文本区域。第二,利用小波的优良去噪性,提出了基于小波变换的图像二值化方法。先将待处理复杂图像转化为灰度图像,然后利用小波分解、多层小波滤波、小波重构将图像中的前景文字作为噪音去除,从而得到图像的背景分布;将背景分布与灰度图像做差运算得到图像的前景分布;再计算局部阈值;最终得到二值化图像。通过与其他著名的八种二值化方法进行对比实验,表明基于小波变换的二值化方法优于其他方法。然后采用深度遍历方法和形态学的膨胀操作对二值化图像进行连通体抽取,选取连通体关键特征,基于条件随机场模型进行文本分割。选取合理的实验参数,CRF模型能够很好地对连通体进行分类,达到文本分割的目的。第三,使用改进的HOG特征对文字进行识别。考虑在倾斜、光照不均、噪音干扰、边缘柔化等多种异态情况下的复杂图像的字符识别问题,提出基于稀疏编码与梯度方向直方图相结合的SC-HOG方法来进行字符识别研究。此方法先利用稀疏编码得到基向量和稀疏系数,通过重构图像滤除噪音、处理边缘柔化;然后利用梯度方向直方图抽取复原图像的字符边缘梯度特征,削弱倾斜和光照的影响;最后将获取的特征向量送入分类器,实现异态字符的识别。通过在设计字符集和现实字符集上进行字符识别实验表明,SC-HOG方法能够对上述复杂情况的图像中包含的文本进行有效的识别。最后,利用上述关键技术的研究成果,构建基于关键词的敏感网络图像过滤系统。

项目成果

期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(6)
专利数量(0)
异态汉字识别方法研究
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    软件学报
  • 影响因子:
    --
  • 作者:
    李成学;王庆人;赵宏;张健
  • 通讯作者:
    张健
Research on born-digital image text extraction based on conditional random field
基于条件随机场的原生数字图像文本提取研究
  • DOI:
    10.1504/ijhpsa.2014.059873
  • 发表时间:
    2014-03
  • 期刊:
    Int. J. High Performance Systems Architecture
  • 影响因子:
    --
  • 作者:
    Jian Zhang;Renhong Cheng;Kai Wang;Hong Zhao
  • 通讯作者:
    Hong Zhao
基于混合编程模型的支持向量机训练并行化
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机研究与发展
  • 影响因子:
    --
  • 作者:
    刘学臣;张帅;王恺;杨愚鲁
  • 通讯作者:
    杨愚鲁

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

溪荪新品种_斑蝶
  • DOI:
    10.16420/j.issn.0513-353x.2017-0143
  • 发表时间:
    2017
  • 期刊:
    园艺学报
  • 影响因子:
    --
  • 作者:
    王恺;王玲
  • 通讯作者:
    王玲
Stacked Auto-Encoder Based Fault Location in VSC-HVDC
VSC-HVDC 中基于堆叠式自动编码器的故障定位
  • DOI:
    10.1109/access.2018.2848841
  • 发表时间:
    2018
  • 期刊:
    IEEE Access
  • 影响因子:
    3.9
  • 作者:
    罗国敏;姚长元;刘瑛琳;谭颖婕;和敬涵;王恺
  • 通讯作者:
    王恺
利用大地测量和地热资料联合确定黑水—泉州地学断面东段岩石圈热及强度结构
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    地球物理学进展
  • 影响因子:
    --
  • 作者:
    王恺;熊熊;WANG Kai1,2,XIONG Xiong1(1.Key Laboratory of Dynam;2.Graduate School,Chinese Academy of Sciences,Beij
  • 通讯作者:
    2.Graduate School,Chinese Academy of Sciences,Beij
脉动射流驱散上隅角积聚瓦斯的模拟实验研究
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    中国矿业大学学报
  • 影响因子:
    --
  • 作者:
    杨胜强;俞启香;王恺;张仁贵
  • 通讯作者:
    张仁贵
冲击矿压巷道围岩控制的强弱强力学模型及其应用分析
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    岩土力学
  • 影响因子:
    --
  • 作者:
    王恺;郑百生;张农;高明仕;窦林名
  • 通讯作者:
    窦林名

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

王恺的其他基金

低氧模拟反应调控小口径人工血管再生的作用及细胞来源研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    55 万元
  • 项目类别:
    面上项目
低氧模拟反应调控小口径人工血管再生的作用及细胞来源研究
  • 批准号:
    82172106
  • 批准年份:
    2021
  • 资助金额:
    55.00 万元
  • 项目类别:
    面上项目
仿生电信号血管材料调控血管组织再生与功能稳态的作用研究
  • 批准号:
    91939112
  • 批准年份:
    2019
  • 资助金额:
    40.0 万元
  • 项目类别:
    重大研究计划
聚合物熔融纺丝纤维与脱细胞基质构成的杂化人工血管材料的构建与功能修饰研究
  • 批准号:
    81772000
  • 批准年份:
    2017
  • 资助金额:
    55.0 万元
  • 项目类别:
    面上项目
生物活性人工血管体内降解及血管再生调控
  • 批准号:
    81401534
  • 批准年份:
    2014
  • 资助金额:
    23.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码