非结构化数据中威胁本体构建、实体识别与关系抽取方法研究

批准号:
61902265
项目类别:
青年科学基金项目
资助金额:
25.0 万元
负责人:
黄诚
依托单位:
学科分类:
F0205.网络与系统安全
结题年份:
2022
批准年份:
2019
项目状态:
已结题
项目参与者:
--
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
项目以非结构化数据中海量威胁情报信息抽取为出发点,将威胁情报知识图谱构建方法作为主要方向,研究其中威胁本体构建、实体识别与关系抽取中尚未解决的关键理论问题,首先以不同类型数据中威胁本体表现形式分析与抽象方法为目标,研究支持可扩展知识库的威胁本体构建方法,解决威胁本体构建过程中跨知识库的差异性特征分析与融合问题;然后研究威胁实体类型分析与识别方法,在结合威胁情报领域知识、威胁实体类型特征、通用领域实体识别的理论知识上,提出基于细粒度实体类型特征的威胁实体识别方法,解决通用领域实体识别方法在威胁情报领域的适应性与优化问题;最后针对已有威胁实体类型提取方法存在关系涵盖不全、准确率低等问题,研究威胁实体间复杂关系的产生机理与抽取方法,提出基于图神经网络的威胁实体间关系抽取方法,从而构建完善的威胁实体间关系抽取模型。项目研究成果可以为情报挖掘、攻击溯源、团队画像等提供更有效的理论知识和技术支持。
英文摘要
Aiming at extracting massive threat intelligence from unstructured data, the work studies the method of constructing threat intelligence knowledge graph as the main research direction, and solves the key issues in threat ontology construction, entity recognition and relation extraction. Firstly, representation analysis and abstract method are proposed for threat ontology in different types of data. The threat ontology construction method supporting the scalable knowledge base is studied, and the differential feature analysis and fusion problem of the cross-knowledge database in the threat ontology construction process is solved. Secondly, the threat entity type is investigated. The work proposes a threat entity recognition method based on fine-grained entity type features to solve threat entity recognition problem in the field of threat intelligence, considering the features of knowledge of threat intelligence, the characteristics of threat entity types, and the knowledge of general filed recognition theory. Finally, in order to solve the incomplete coverage and low accuracy of existing threat entity type extraction methods, the work studies the mechanism and extraction method of threat entity relations, and demonstrates a threat entity relation extraction model based on graph neural network algorithm. The research can provide more effective theoretical knowledge and support for threat intelligence mining, attack investigation, threat actor profiling.
威胁情报驱动的信息安全防御已成为业界公认的信息安全未来发展方向,其面向非结构化数据的威胁情报知识库构建及应用意义重大。项目以海量威胁情报信息抽取为出发点,将威胁情报知识图谱构建方法作为主要方向,研究了威胁本体构建、实体识别与关系抽取中尚未解决的关键理论问题,首先以不同类型数据中威胁本体表现形式分析与抽象方法为目标,提出了支持可扩展知识库的威胁本体构建方法,解决威胁本体构建过程中跨知识库的差异性特征分析与融合问题;然后在结合威胁情报领域知识、威胁实体类型特征、通用领域实体识别的理论知识上,提出基于细粒度实体类型特征的威胁实体识别方法,解决了通用领域实体识别方法在威胁情报领域的适应性与优化问题;最后针对已有威胁实体类型提取方法存在关系涵盖不全、准确率低等问题,提出基于图神经网络的威胁实体间关系抽取方法,从而构建完善的威胁实体间关系抽取模型。研究中将项目成果在特定场景中进行了应用,其构建的知识库为情报挖掘、攻击溯源、团队画像等提供更有效的技术支持。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
ExpSeeker: extract public exploit code information from social media
ExpSeeker:从社交媒体中提取公开的漏洞利用代码信息
DOI:10.1007/s10489-022-04178-9
发表时间:2022-11
期刊:Applied Intelligence
影响因子:5.3
作者:Yutong Du;Cheng Huang;Genpei Liang;Zhihao Fu;Dunhan Li;Yong Ding
通讯作者:Yong Ding
SankeyVis: Visualizing active relationship from emails based on multiple dimensions and topic classification methods
SankeyVis:基于多维度和主题分类方法可视化电子邮件中的活跃关系
DOI:10.1016/j.fsidi.2020.300981
发表时间:2020-12-01
期刊:FORENSIC SCIENCE INTERNATIONAL-DIGITAL INVESTIGATION
影响因子:2
作者:Fang, Yong;Zhao, Cuirong;Liu, Liang
通讯作者:Liu, Liang
CyberEyes: Cybersecurity Entity Recognition Model Based on Graph Convolutional Network
CyberEyes:基于图卷积网络的网络安全实体识别模型
DOI:10.1093/comjnl/bxaa141
发表时间:2020-12
期刊:The Computer Journal
影响因子:--
作者:Yong Fang;Yuchi Zhang;Cheng Huang
通讯作者:Cheng Huang
DOI:10.11772/j.issn.1001-9081.2021050877
发表时间:2022
期刊:计算机应用
影响因子:--
作者:黄诚;赵倩锐
通讯作者:赵倩锐
NEDetector: Automatically extracting cybersecurity neologisms from hacker forums
NEDetector:从黑客论坛自动提取网络安全新词
DOI:10.1016/j.jisa.2021.102784
发表时间:2021-05
期刊:Journal of Information Security and Applications
影响因子:5.6
作者:Ying Li;Jiaxing Cheng;Cheng Huang;Zhouguo Chen;Weina Niu
通讯作者:Weina Niu
国内基金
海外基金
