面向多语法语义日志的数据中心网络设备异常检测机制研究
结题报告
批准号:
61902200
项目类别:
青年科学基金项目
资助金额:
25.0 万元
负责人:
张圣林
依托单位:
学科分类:
F0207.计算机网络
结题年份:
2022
批准年份:
2019
项目状态:
已结题
项目参与者:
--
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
客服二维码
微信扫码咨询
中文摘要
对网络设备进行异常检测,是保证数据中心稳定的重要手段,对于保障国家行政、金融、电力、电信、互联网等方面的安全与稳定至关重要。申请人前期研究发现,基于日志的网络设备异常检测可为进一步的异常定位和根因分析奠定坚实的基础。鉴于此,本项目致力于提出一种基于日志的网络设备异常检测机制,以准确、高效、通用地解析日志并检测单条异常日志和异常日志序列。提出可动态添加分支的频繁项前缀树结构构建模板集合,实现准确提取事件、支持增量式学习模板、快速匹配模板的日志解析。针对不同型号设备日志的语法语义存在较大差异,综合考虑词频和位置,使用词袋模型构建特征向量,并使用PU learning基于部分标记的单条异常日志学习异常模式。此外,提出面向日志噪声和样本失衡的通用异常日志序列检测方法,使用词嵌入方法基于单词语义对消息模板聚类。本项目的实施,将提高数据中心网络设备异常检测的效率和准确性,有利于异常定位和根因分析。
英文摘要
Detecting anomalies of network devices is an important aspect to keep datacenters stable, which is of vital importance to the safety and stability of a nation’s administration, finance, telecommunication, and Internet. Based on our previous investigations, we find that log-based anomaly detection for network devices can greatly improve the performance of further anomaly localization and root cause analysis. Consequently, in this project we try to propose a log-based anomaly detection mechanism for network devices, in order to accurately, efficiently and universally parse logs and detect anomalous single logs and log sequences. We propose a frequent-item based prefix-tree which dynamically adds branches to construct template sets, so as to accurately extract the events, incrementally learn templates, and quickly match logs to templates. Because the logs of different models of network devices are very different in syntax and semantics, we weight words based on both frequency and location in constructing feature vectors for the bag-of-words model. In addition, we use the PU learning model to learn anomalous patterns from partially labelled single anomalous logs. Moreover, we propose a universal anomaly detection method for log sequences, which aims to address the challenges of noisy signals and sample imbalance. Based on the semantics of words, we leverage the word embedding method to cluster message templates. This project will improve the efficiency and accuracy of anomaly detection for network devices in datacenter networks, and is helpful to further anomaly localization and root cause analysis.
高效、准确的日志检测异常对于业务管理和系统维护至关重要,为ICP服务性能管理带来了机遇与挑战。本体系结构不仅能主动发现网络设备的异常以及时采取应对措施,而且克服了基于监控指标数据进行异常检测的缺点。研究内容包括三部分:网络设备日志解析,基于部分异常标记的网络设备单条异常日志检测,网络设备异常日志序列检测方法。经过2年研究,项目组在上述3项研究内容取得了重要进展。项目组提出了以一种增量方式学习新的模板LogParse,实现了自适应跨服务;提出了利用部分标记对异常日志进行自动检测的分类框架LogClass,解决了语法语义存在较大差异的问题;提出了一种面向多语法日志的通用异常检测机制LogMerge,解决异常日志序列中噪声信号较多、不同型号网络设备各异问题。这些成果丰富了数据中心网络设备异常检测的理论和方法,在相关关键技术上有较大突破和创新。为了准确、全面地评估日志异常检测机制,本项目共使用了8个公共日志数据集进行实验。项目执行期间,项目组发表了学术论文11篇,其中IEEE Transactions 国际期刊 2篇,申请国内发明专利6项。共联合培养硕士毕业生4人,其中1人获得南开大学“优秀毕业生”荣誉称号。项目组圆满完成了项目计划书的研究计划,达到了预期的研究目标。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
Efficient KPI Anomaly Detection Through Transfer Learning for Large-Scale Web Services
通过大规模 Web 服务的迁移学习进行高效 KPI​​ 异常检测
DOI:10.1109/jsac.2022.3180785
发表时间:2022-08
期刊:IEEE Journal on Selected Areas in Communications (JSAC)
影响因子:--
作者:Shenglin Zhang;Zhenyu Zhong;Dongwen Li;Qiliang Fan;Yongqian Sun;Man Zhu;Yuzhi Zhang;Dan Pei;Jiyan Sun;Yinlong Liu;Hui Yang;Yongqiang Zou
通讯作者:Yongqiang Zou
Detecting Outlier Machine Instances Through Gaussian Mixture Variational Autoencoder With One Dimensional CNN
使用一维 CNN 通过高斯混合变分自编码器检测离群机器实例
DOI:10.1109/tc.2021.3065073
发表时间:2021-03
期刊:IEEE Transactions on Computers
影响因子:3.7
作者:Ya Su;Youjian Zhao;Ming Sun;Shenglin Zhang;Xidao Wen;Yongsu Zhang;Xian Liu;Xiaozhou Liu;Junliang Tang;Wenfei Wu;Dan Pei
通讯作者:Dan Pei
DOI:10.1016/j.jss.2022.111322
发表时间:2022-04
期刊:J. Syst. Softw.
影响因子:--
作者:Yongqian Sun;Kunlin Jian;Liyue Cui;Guifei Jiang;Shenglin Zhang;Yuzhi Zhang;Dan Pei
通讯作者:Yongqian Sun;Kunlin Jian;Liyue Cui;Guifei Jiang;Shenglin Zhang;Yuzhi Zhang;Dan Pei
LogClass: Anomalous Log Identification and Classification With Partial Labels
LogClass:部分标签的异常日志识别与分类
DOI:10.1109/tnsm.2021.3055425
发表时间:2021-01
期刊:IEEE Transactions on Network and Service Management
影响因子:5.3
作者:Weibin Meng;Ying Liu;Shenglin Zhang;Federico Zaiter;Yuzhe Zhang;Yuheng Huang;Zhaoyang Yu;Yuzhi Zhang;Lei Song;Ming Zhang;Dan Pei
通讯作者:Dan Pei
面向多模态数据的大规模云平台故障诊断机制研究
  • 批准号:
    --
  • 项目类别:
    面上项目
  • 资助金额:
    55万元
  • 批准年份:
    2022
  • 负责人:
    张圣林
  • 依托单位:
国内基金
海外基金