Web页面数据对象的感知理解与计算

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61462010
  • 项目类别:
    地区科学基金项目
  • 资助金额:
    45.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F06.人工智能
  • 结题年份:
    2018
  • 批准年份:
    2014
  • 项目状态:
    已结题
  • 起止时间:
    2015-01-01 至2018-12-31

项目摘要

The complexity and the heterogeneity of Webpage data has always been a bottleneck in its efficient processing. The technique of page blocking and information extracting have been eased the problem in a certain extent, but failed to solve the problem of semantic structuralizing fundamentally . In response to this challenging problem,the project takes the Webpage as the research object, bases on the charcteristics of compilation language of Web page and the distribution characteristics of information in the page, takes use of the related theory and technology of statistics and information science to research the model and method of semantic perception of Webpage data object, explore the measure learning theory and technology of semantic object, build the across granularity weighted semantic object tree model, reveal the mapping mechanism from semantic object to the grain object, meanwhile establish a multi-granularity view of Webpage and its associated model. The mainly research contents include: the perception of the semantic theme of Webpage contents based on the LDA model; short text classification based on spectral clustering; the semantic blocking of Webpage based on visual information and formation content; The measure learning of semantic object in the Webpage; The construction of across the granularity weighted semantic object tree ; Multi-granularity review and its associated modeling, etc. The model and method of perception understanding and calculation established in the project for Webpage data object will have theoretical significance and practical prospects in the management of Web information integration, intelligent retrieval and analysis mining, as well as other fields.
Web页面数据的复杂异构一直是其高效处理的瓶颈,页面分块及信息抽取在一定程度上缓解了这一问题,但未能从根本上解决语义结构化问题。针对这一挑战性的问题,本项目拟以Web页面为研究对象,基于Web页面编撰语言特点,依据页面中信息内容及分布特征,利用统计学和信息科学相关理论和技术,研究Web页面数据对象的语义感知模型与方法,探索语义对象的测度学习理论和技术,构建跨粒度加权语义对象树模型,揭示语义对象到粒对象的关联映射机制,建立多粒度视图的Web页面表示及关联模型。具体研究内容包括:基于LDA模型的Web文本主题感知;基于谱聚类的短文本分类;基于视觉信息和信息内容的语义分块;Web页面语义对象测度学习;跨粒度加权语义对象树构造;Web页面多粒度表示与关联建模等。本项目所建立的Web页面数据感知理解与计算模型和方法,对Web信息集成管理、智能检索与分析挖掘等多个领域具有重要的理论意义和实用前景。

结项摘要

本项目从一种新的视角出发,以平面视图的Web页面为研究对象,以页面中数据对象及概念为基本单元,综合利用Web语义技术、认知科学、概率统计学和数据挖掘中基本理论和方法,研究Web页面数据对象的语义感知理解与计算模型、技术和方法,重点研究了如何从数据挖掘、语义计算、自然语言处理与文本分类等多方面,对传统Web页面数据对象的感知理解与计算模型进行突破与改良。首先,深入研究了Web文档主题特征提取、Web页面文档区块数据对象语义特征感知与短文本分类等技术,提出了一种基于哈夫曼树算法的文档分类新方法,一种基于期货经纪交易数据库的文档区块分类算法,以及一种基于本体与结构的Web表抽取方法,发表了四篇EI学术会议论文。其次,深入研究了感知理解Web页面数据对象的数据挖掘与分类技术,提出了一种偏好代价敏感决策树构造方法,一种基于单位代价收益敏感决策树的分类方法,以及一种基于依存关系、词性和语义词典的类中心向量文本分类法,发表了2篇中文核心论文,申请了3个发明专利并获得了1个发明专利授权。再者,深入研究了基于本体与真实语料的Web概念语义相似度计算与基于内容的图像检索技术,提出了一种用于相似度计算的区域密度补偿的路径计算模型,一种测量语义相关性的维基百科双向链接向量模型,一种基于句法结构与修饰词的句子相似度计算,以及一种基于内容的彩色体直方图图像检索技术,构建了从概念与文本到图像的Web页面数据对象的多粒度视图及关联模型,发表了二篇高水平的SCI论文、二篇EI论文、6篇中文核心论文及一篇会议论文,申请了一个发明专利,获得了二个软件著作权。最后,深入研究了Web页面数据对象感知在智能教学系统及智能系统方面的应用,提出了一种基于本体与SCORM规范的智能内容对象互操作模型,一种基于领域本体和多代理的分布式智能教学系统,以及一种谈话式智能教学系统;申请了9个相关发明专利并获得了5个授权,并在SSCI期刊上发表学术论文一篇。

项目成果

期刊论文数量(13)
专著数量(0)
科研奖励数量(0)
会议论文数量(9)
专利数量(13)
一种基于词频歧义消解的通用中文分词法
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    广西师范大学学报:自然科学版
  • 影响因子:
    --
  • 作者:
    彭琦;朱新华;陈意山
  • 通讯作者:
    陈意山
基于多重继承与信息内容的知网词语相似度计算
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    计算机应用研究
  • 影响因子:
    --
  • 作者:
    张波;陈宏朝;朱新华;吴田俊
  • 通讯作者:
    吴田俊
An efficient path computingmodel for measuring semantic similarity using edge and density
一种使用边缘和密度测量语义相似度的有效路径计算模型
  • DOI:
    10.1007/s10115-017-1078-5
  • 发表时间:
    2017
  • 期刊:
    Knowledge and Information Systems
  • 影响因子:
    2.7
  • 作者:
    Xinhua Zhu;Fei Li;Hong-chao Chen
  • 通讯作者:
    Hong-chao Chen
基于路径与深度的同义词词林词语相似度计算
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    陈宏朝;李飞;朱新华;马润聪
  • 通讯作者:
    马润聪
一种单位代价收益决策树剪枝算法
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    计算机工程与科学
  • 影响因子:
    --
  • 作者:
    周美琴;陈诗旭;袁鼎荣;朱新华
  • 通讯作者:
    朱新华

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

我国经济增长与土地违法的Kuznets曲线分布与治理研究——基于2001-2011年省际数据的检验
  • DOI:
    10.13300/j.cnki.hnwkxb.2015.04.014
  • 发表时间:
    2015
  • 期刊:
    华中农业大学学报(社会科学版)
  • 影响因子:
    --
  • 作者:
    欧胜彬;张耀宇;陈思源;朱新华
  • 通讯作者:
    朱新华
基于介电频谱的采后苹果可溶性固形物含量无损检测
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    农业机械学报
  • 影响因子:
    --
  • 作者:
    郭文川;商亮;王铭海;朱新华
  • 通讯作者:
    朱新华
An Improved Chinese Word Semantic Similarity Algorithm based on CiLin
基于CiLin的改进中文词语语义相似度算法
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    Journal of Information & Computational Science
  • 影响因子:
    --
  • 作者:
    李飞;朱新华;陈宏朝;马润聪;邓涵
  • 通讯作者:
    邓涵
RNA干扰在呼吸道过敏性疾病中对肥大细胞的作用研究
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    临床耳鼻咽喉头颈外科杂志
  • 影响因子:
    --
  • 作者:
    伍书红;朱新华
  • 通讯作者:
    朱新华
近红外光谱结合极限学习机识别贮藏期的损伤猕猴桃
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    光学精密工程
  • 影响因子:
    --
  • 作者:
    郭文川, 王铭海;谷静思;朱新华
  • 通讯作者:
    朱新华

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

朱新华的其他基金

基于知识图谱与神经网络的智能教学系统关键技术研究
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    36 万元
  • 项目类别:
    地区科学基金项目
基于领域本体与技术规范的多代理分布式智能教学系统互操作模型研究
  • 批准号:
    61363036
  • 批准年份:
    2013
  • 资助金额:
    45.0 万元
  • 项目类别:
    地区科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码