【XSS_MSN】基于GCN的web攻击Payload识别与可解释性分析

news/2024/10/18 3:33:29/

原文标题:Web Attack Payload Identification and Interpretability Analysis Based on Graph Convolutional Network 

原文链接:https://ieeexplore.ieee.org/document/10076547/    

作者单位:四川大学网络安全学院

相似原理论文:GraphXSS: an efficient XSS payload detection approach based on graph convolutional network,两篇论文应该来自同一个组,含两个共同作者

论文中Web Payload攻击可分为SQL注入、XSS、命令注入、文件泄露、XML注入等攻击。 

1、论文针对的关键性问题

  • 如何结合字段间的联系以及双向关系用于分析
  • 如何结合微观和宏观视角提取web攻击Payload特征,以减少Payload稀释问题所带来的影响           Hackers will also attempt to construct long payloads for attacks, which serve multiple purposes,The first is to create a buffer overflow error, which can be used as a vulnerability to attack. Secondly, some Web firewalls read a limited number of character lengths and cannot detect content beyond the maximum number. Hackers can use it to construct malicious code after the maximum size. In addition, long payloads can dilute the proportion of malicious content in the payload, reducing the probability of some detection models identifying them as malicious。
  • 如何构建一个更具解释性的web攻击Payload检测模型

2、论文中所做的工作 

  • 提出了一种基于图关系的Web Payload建模方法(基于word),可在宏观视角(图)和微观视角(节点)提取Payload的特征
  • 提出了一种基于GCN的Web Payload攻击识别方法,节点的初始特征向量采用Bert预训练模型获取,并由GCN执行节点embedding,进而得到图的表示向量,训练模型得到Payload攻击识别模型。
  • 设计实验并对所提到的方法进行了可解释性分析

3、论文的详细设计

        1)Web Payload 图构建

        Web Payload图类型: 无向图

        两种节点类型:字段名称(field name)、参数值依据预设规则切分后的token。进一步论文在构建图时分为了纯数字、纯字母、特殊字符以及其他四种节点类型,各自占比如下。

        三种边类型:字段名称之间的双向连接、字段名称与参数值的(value的第一个token)连                                     接、参数值token之间的序列关系

        2)检测框架说明

              数据层:数据来自Web服务器日志和Pcap文件,Payload均含字段名称和参数值,对混                               淆的Payload执行解码、等式替换以及无关字符删除等多次类似的数据恢复操作。

              图构建层:参考1),节点特征通过预训练的Bert模型获取。

              训练层:采用GCN训练,做图分类任务

        3)可解释性分析

        通过删除节点,计算每个节点的影响率,通过分析高影响率的节点来做可解释性分析。

4、实验分析

        数据集:CSIC 2010 v2 HTTP dataset

        实验主要结果:论文实验是做图分类任务,使用RF、LSTM、SVM等做对比实验时,提取了节点特征做融合,作为某个Web Payload的特征向量。

5、总结

        论文使用Web payload参数对进行图构建,并进一步将节点类型划分为纯数字、纯字符、特殊字符以及其他共四种类型,边包含参数之间的互联关系、参数与参数值第一个token的邻接关系、参数值的序列关系三种,最后做一个GCN图分类任务,同时对预测结果的可解释性做了初步探索,其结果表明与Web攻击相关的字符拥有更高的积极影响。


http://www.ppmy.cn/news/1165590.html

相关文章

使用EasyExcel实现Excel导入导出

介绍 EasyExcel是一个基于Java的、快速、简洁、解决大文件内存溢出的Excel处理工具。 他能让你在不用考虑性能、内存的等因素的情况下,快速完成Excel的读、写等功能。 快速:快速的读取excel中的数据。 简洁:映射excel和实体类,让…

linux - 简单上传下载文件(lrzsz、scp)

概述 在新建的服务器大搭建环境中,偶尔会遇到一些临时改动的问题,比如想把本地文件传输到远程服务器,或者是下载远程服务器的文件,介绍lrzsz和scp命令进行文件的上传和下载,我本地的开发环境是mac本,如果是…

【华为认证超全科普帖】

华为认证是由华为基于“平台生态”战略,围绕“云-管-端”协同的新ICT技术架构,打造的业界覆盖ICT领域蕞广的认证体系。在信息和通信技术行业具有较高的含金量。 华为认证分为3个等级: HCIA (初级):华为认证ICT工程师 HCIP (中级)&#xff1…

中国社科院与美国杜兰大学金融管理硕士---不将就的人生

“万般皆下品,惟有读书高”、“书中自有颜如玉,书中自有黄金屋”,古往今来,读书的好处为人们所重视。从而想拿到学历没有知识的沉淀,没有一定的学识水平,又怎么能拿到含金量颇高的学历呢?退一步…

vue解决报错Unable to preventDefault inside passive event listener invocation.

"Unable to preventDefault inside passive event listener invocation"是浏览器开发中的一个警告信息。这个警告通常出现在使用passive事件监听器时,当在事件处理函数中调用preventDefault()方法时会引发该警告。 在传统的事件监听模型中,当…

代碼隨想錄算法訓練營|第四十四天|01背包问题 二维、01背包问题 一维、416. 分割等和子集。刷题心得(c++)

目录 01背包問題 - DP二維數組 01 背包問題描述 暴力解 動態規劃 確認DP數組以及下標的含意 確定遞推公式 01背包问题 一维 一维DP 数組(滾動数組) 動態規劃五部曲 定義DP数組以及其下標含意 遞推公式 初始化 遍歷順序 讀題 416. 分割等和子集 自己看到题目的第…

数据防泄密软件排行榜

数字化时代,数据已成为企业的重要资产。然而,数据泄露事件却时常发生,给企业带来巨大的经济损失和声誉风险。因此,数据防泄密软件的重要性日益凸显。 数据防泄密软件是什么 它是一种专门用于防止敏感数据泄露的软件工具。它通过对…

服务器性能高低判断

服务器性能高低判断 1、稳定性测试 已知系统高峰期使用人数、各事务操作频率等。设计综合测试场景,测试时,将每个场景按照一定人数比例一起运行,模拟用户使用数的情况。并监控在测试中,系统各性能指标在这种压力下是否能保持正常数…