一种基于机器学习的面向内生安全系统的入侵修复方式

news/2024/11/1 14:15:17/

摘要:本文主要是根据上课老师所提供的题目以及平时上课的学习,结合自己的理解按照要求设计的一种基于机器学习等方法的面向内生安全系统的入侵修复方式和系统,虽然大部分只是一种猜想并未实际实现,但是所体现的创新性等也是有可取之处的。

关键词:内生安全 入侵修复 机器学习 人工智能

内生安全是指利用系统的自身架构、仿照人类免疫系统运行规划机制等内源性效应而获得的安全系统。个人认为,所谓“内生安全”应该具有自适应、自主性、自生长三个特点,类似于人体免疫系统的获得性免疫过程,结合机器学习算法设计出一种面向内生安全系统的入侵修复方式,其大致概略图如下所示:

基于机器学习的面向内生安全系统的入侵修复系统设计图

上述模型部分参考了IDWG制定的通用入侵检测系统模型,即通用入侵检测框架(CIDF)。在 CIDF 的基础框架之上,将机器学习算法应用到入侵检测模型的构建中,并结合内生安全的实际需要,构建出上述结构图。下面对应题目中所给出的免疫系统来进行对照功能与作用的介绍。

首先一些危害系统安全的行为发生,诸如病毒、蠕虫、木马、逻辑炸弹等攻击,类似于免疫系统中病毒、病菌等侵入人体。此时对应阶段即为数据收集阶段,系统不断地收集网络流量数据、系统日志数据、应用程序日志数据等。

接着,病原体进入人体后,刺激淋巴细胞,值得注意的是,在刺激淋巴细胞的过程中,只有病原体的部分有用特征起到作用,这也是淋巴细胞用来区别不同病原体的特征。在获得性免疫中,抗原呈递是指抗原进入机体后,被吞噬细胞吞噬、消化和呈递抗原的过程。这个过程是启动和调节特异性免疫应答的关键步骤。而数据预处理正是对应于获得性免疫中的“抗原呈递”这一步,是启动和调节机器学习算法的关键步骤。预处理阶段,即使用数据清洗和预处理技术对数据进行处理,以便于机器学习算法的使用。此处设计时,考虑用到四种数据清理与预处理的手段:(1)符号特征数值化首先要将字符型数据转化为数值型数据。对于离散型的字符数据,采用标签编码的方法将其转化为连续的数值型数据。(2)数值特征归一化:将数值类型的特征进行线性或非线性变换,以缩小量值、简化计算。可以去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。可以将所有的特征都统一到一个大致相同的数值区间内,提高分类器的准确性。(3)数据抽样:又称取样,是一种从数据集中随机抽取数据子集进行调查和分析的方法。目的是通过从数据总体中抽取部分数据进行研究,来估计和推断总体数据的特征。(4)特征选择:指从原始数据集中选择对于目标变量最具有预测能力的特征子集的过程。在机器学习中,特征选择可以有效减少特征数量,降低模型复杂度,提高模型的泛化能力和预测性能。可以避免过拟合,减少计算复杂度和存储空间消耗。常用的特征选择方法包括过滤式、包裹式和嵌入式等方法。

接下来,淋巴细胞接受病原体刺激,在所接受的所有特征中,需要进行有用特征的提取,作为唯一判定病原体分类的依据,这对应于特征提取阶段,系统从数据中提取与入侵检测和修复相关的特征,如网络流量中的异常检测、文件哈希值的对比、程序代码的静态分析等。

在病原体刺激淋巴细胞后,淋巴细胞将会产生特异性免疫球蛋白或免疫淋巴细胞,二者将会在之后的免疫过程中起到清除病原体的作用。这对应于模型训练阶段,即使用机器学习算法,如监督学习、无监督学习和强化学习等,对收集到的数据和特征进行训练,构建入侵检测和修复模型。在设计中采用四种机器学习方法:(1)有监督学习:在入侵检测中,有监督意味着可以用已经标记的训练数据调整算法的参数,增强算法对未知入侵类别的检测率。最重要的有监督学习算法有K最近邻、朴素贝叶斯、支持向量机、决策树以及人工神经网络算法。主要优点包括:准确度高、可解释性强应用广泛学习速度快等。(2)无监督学习:优点在于不需要对数据进行标记,可以处理无标记数据,同时也可以提高入侵检测的准确性和效率。无监督学习算法在入侵检测中的应用主要有聚类分析将网络流量数据分成若干个簇,簇内的数据相似度高,簇间的数据相似度低)、关联规则挖掘挖掘网络流量数据中各变量之间的关联关系,从而发现潜在的入侵模式)、密度峰值聚类将网络流量数据中的每个数据点分为两类:核心点和噪声点。核心点周围的数据点密度较高,而噪声点周围的数据点密度较低)。(3)深度学习:是一种基于神经网络的机器学习方法,核心思想是通过学习多层次的特征表达来实现数据的高效表征和分类,常用的算法包括卷积神经网络(CNN)、循环神经网络(RNN)、长短时记忆网络(LSTM)、生成对抗网络(GAN)等。深度学习的优点主要有四点:高效的特征提取能力:通过多层次的特征提取、能够处理大规模数据、具有良好的泛化能力、可以自动进行特征选择和提取。(4)集成学习:是一种将多个学习器进行结合以提高预测性能的方法。常用的算法包括bagging、boosting和stacking等。集成学习的优点包括提高预测性能、保证弱分类器的多样性、容易实现和参数较少等。

接下来的模型评估阶段是指使用测试数据集对训练好的模型进行评估,计算模型的准确率、召回率、F1值等指标,并根据评估结果对模型进行优化。可以对应于获得性免疫中的“免疫耐受”这一步。免疫耐受是指机体在接触抗原(如细菌、病毒等病原体)后,产生特异性免疫反应之前,对自身成分产生的免疫耐受现象。其主要作用是防止机体对自身成分产生免疫攻击,从而保持机体的免疫平衡状态。在模型评估中,通常需要对模型进行训练和测试,并对模型的性能指标进行计算和评估。这个过程类似于获得性免疫中,在机体接触抗原后,对其进行测试和评估,以确定其是否具有免疫原性,即能否引起特异性免疫反应。

当下一次有病原体侵入人体中时,免疫淋巴细胞会对入侵人体的病原体进行识别,这对应于入侵检测阶段,即将系统监控到的实时数据输入到训练好的模型中进行检测,如果发现异常或入侵行为,则触发修复机制。

免疫球蛋白或免疫淋巴细胞与该抗原起特异性反应,破坏病原体。这对应于入侵修复阶段,即根据检测到的入侵行为,采取相应的修复措施,例如关闭受攻击的端口、更新病毒库、重新部署应用程序等。

最后,抗体与免疫细胞浓度在人体中是不断变化的,这是人体根据不同状况的一种更新与调节。这对应于系统更新阶段,即根据系统的运行情况和入侵特征的变化,对系统进行更新和优化,以提高系统的可靠性和安全性。

以上就是本文所设计的基于机器学习的面向内生安全系统的入侵修复方式的全部内容。根据本文所假设的系统满足内生安全中所涵盖的三个特点,结合机器学习算法,符合实际情况与题目要求,虽然没有实际操作以实现该系统,但是其蕴含的思想与创新性亦有可取之处。


http://www.ppmy.cn/news/1543604.html

相关文章

Lua 函数

Lua 函数 Lua 是一种轻量级的编程语言,广泛用于游戏开发、脚本编写和其他应用程序中。在 Lua 中,函数是一等公民,这意味着它们可以被赋值给变量,作为参数传递给其他函数,甚至可以作为其他函数的返回值。本文将详细介绍…

Rust 力扣 - 1423. 可获得的最大点数

文章目录 题目描述题解思路题解代码题解链接 题目描述 题解思路 题目所求结果存在下述等式 可获得的最大点数 所有卡牌的点数之和 - 长度为(卡牌数量 - k)的窗口的点数之和的最小值 我们遍历长度为(卡牌数量 - k)的窗口&#…

springboot2.x使用SSE方式代理或者转发其他流式接口

文章目录 1.需求描述2.代码2.1.示例controller2.2.示例service2.3.示例impl 3.测试 1.需求描述 使用SSE的方式主要还是要跟前端建立一个EventSource的链接,有了这个连接,然后往通道里写入数据流,前端自然会拿到流式数据,写啥拿啥…

同城行业交流圈子/交友圈子论坛系统有哪些开源架构与优势解析

开源架构 前端 Vue.js与uni-app框架:前端常采用Vue.js框架,特别是结合uni-app进行跨平台开发。uni-app是一个使用Vue.js开发所有前端应用的框架,支持编译为H5、小程序、App等多个平台,实现代码的一次编写,多端运行。…

【机器学习】有监督学习·由浅入深讲解分类算法·Fisher算法讲解

博主简介:努力学习的22级计算机科学与技术本科生一枚🌸博主主页: Yaoyao2024往期回顾: 【机器学习】深入浅出讲解贝叶斯分类算法每日一言🌼: Rivers know this:There is no hurry. We shall get there. 0、…

单例 C++ 懒汉+恶汉

单例设计模式是一种创建型设计模式,确保一个类只有一个实例,减少了内存的开销,并提供一个全局访问点访问该实例。 私有化构造函数、拷贝构造函数、赋值函数 ,定义一个类的私有静态对象成员,定义一个公共的访问该实例静…

一文解析——如何月入过万不是梦

在TikTok(简称TK)这个充满活力的短视频平台上,想要实现大规模的商业价值,有效的账号管理和引流策略至关重要。而TK防关联引流系统的出现,无疑为众多品牌和营销者提供了一个高效、低成本的管理和增长解决方案。通过这一…

【51单片机】矩阵键盘

学习使用的开发板:STC89C52RC/LE52RC 编程软件:Keil5 烧录软件:stc-isp 开发板实图: 文章目录 矩阵键盘 矩阵键盘 矩阵键盘位于开发板的右下角 在键盘中按键数量较多时,为了减少I/O口的占用,通常将按键…