【论文速读】| APOLLO:一种基于 GPT 的用于检测钓鱼邮件并生成警告用户的解释的工具

devtools/2024/11/6 20:39:58/

图片

基本信息

原文标题:APOLLO: A GPT-based tool to detect phishing emails and generate explanations that warn users

原文作者:Giuseppe Desolda, Francesco Greco, Luca Viganò

作者单位:University of Bari “A. Moro”, Italy, King’s College London, UK

关键词:网络钓鱼、LLMs、警告、解释、电子邮件分类

原文链接:https://arxiv.org/pdf/2410.07997

开源代码:https://anonymous.4open.science/r/APOLLO-658A

论文要点

论文简介:本论文提出了一个名为APOLLO的工具,它基于OpenAI的GPT-4o模型,旨在检测网络钓鱼邮件并生成解释信息来警告用户。该工具能够自动分类钓鱼邮件并生成详细的解释,帮助用户理解为什么某封邮件可能是恶意的。这种系统通过增强用户对警告的理解和信任,提高了用户的安全决策能力。论文还通过一项实验验证了该工具在邮件分类任务中的性能,展示了97%的分类准确率,并在结合第三方数据后,准确率提升至99%。

研究目的:网络钓鱼攻击因其复杂性和不断进化的手段,已成为当今网络犯罪中最广泛且有效的攻击方式之一。研究的目的在于通过利用大语言模型(LLMs),提出一种能够自动检测和解释网络钓鱼邮件的防御工具,旨在提高用户对潜在威胁的防御能力。传统的警告系统虽然能够检测恶意内容,但缺乏有效的解释信息,使得用户在面对复杂攻击时缺乏足够的决策依据。APOLLO的设计旨在填补这一空白,既提高了技术检测的准确性,又增强了用户在面对警告时的信任感和理解力。

引言

如今的数字世界依赖度极高,网络钓鱼攻击已成为对用户、组织和IT系统的重大威胁。这些攻击之所以成功,是因为它们利用了人类的认知弱点,如缺乏知识、时间压力和情绪化判断。因此,随着钓鱼攻击的日益复杂化,迫切需要加强钓鱼防护,涵盖技术和人类两个方面。尽管现代浏览器和邮件客户端已经具备高级技术手段来检测可疑内容,但许多警告系统仍未能有效地保护用户。传统的警告缺乏详细解释,无法帮助用户了解威胁背后的原因。

本论文提出了一种基于大语言模型的解决方案,旨在动态生成个性化的解释信息,帮助用户理解并规避潜在的网络钓鱼攻击。这种方法通过自动生成解释,取代了目前手动编写警告信息的繁琐过程,使其能够更快、更有效地适应新的攻击手段。

相关工作

本论文主要讨论了与网络钓鱼防护相关的两个领域的研究:警告系统和大语言模型(LLMs)的应用。传统的警告系统往往缺乏解释性内容,用户容易忽视或误解其重要性,尤其是在面对复杂的钓鱼邮件时。而加入解释信息的警告系统则能够帮助用户更好地理解潜在风险,增强警告的有效性。

在LLMs领域,尽管这些模型在文本处理任务中表现优异,但在网络钓鱼防护领域的应用仍然较少。现有研究表明,LLMs在检测网络钓鱼邮件中的潜力巨大,尤其是在识别复杂的社会工程攻击手段时表现出色。通过结合技术手段和人类因素,本论文的研究为LLMs在钓鱼防护中的应用提供了新的方向。

APOLLO

APOLLO系统的核心是利用GPT-4o模型来自动分类邮件并生成解释信息。系统架构包含三个主要模块:预处理模块、URL增强模块和LLM提示模块。预处理模块负责提取和清理邮件内容,将其转换为适合GPT模型处理的格式;URL增强模块通过VirusTotal和BigDataCloud API获取邮件中的URL信息,并将这些外部情报加入模型的推理过程中;最后,LLM提示模块基于邮件和URL信息生成分类结果和详细解释,帮助用户理解邮件的潜在风险。

图片

图片

APOLLO评估

实验方法:APOLLO系统的评估采用了一个包含4000封邮件的数据集,其中一半为钓鱼邮件,另一半为合法邮件。评估过程中,系统首先通过预处理和URL增强模块处理每封邮件,然后使用GPT-4o模型对其进行分类。实验还模拟了不同的外部信息准确度场景,以测试VirusTotal等服务的数据对分类性能的影响。

图片

数据分析:通过精度、召回率、准确率和F1评分等指标来衡量模型的分类效果。此外,还使用了Log-loss和ROC AUC来评估模型的概率估计性能。结果表明,APOLLO在没有URL信息的情况下,仍然能够达到97.4%的准确率,且ROC AUC值接近1.0,表明模型在分类任务中具有极高的辨别能力。

实验结果:实验结果显示,GPT-4o模型在处理网络钓鱼邮件分类任务时表现优异,特别是在引入外部信息(如URL情报)的情况下,准确率进一步提升至99%。然而,如果外部信息质量较低,可能会导致误分类。该系统在应对不同精度的外部信息时表现出较强的鲁棒性,即使在部分错误信息的情况下,仍然能有效检测出钓鱼邮件。

图片

研究评估

通过用户研究评估了APOLLO生成的警告信息的质量。实验招募了20名参与者,比较了APOLLO生成的警告与现有浏览器(如Chrome、Firefox和Edge)的警告,以及手动创建的警告。结果表明,APOLLO生成的警告在理解度、可信度和吸引力上均优于现有解决方案,且用户对其生成的解释信息反馈积极。

研究结果

定量结果:在本次实验中,APOLLO系统使用GPT-4o模型对4000封电子邮件进行分类(包括一半钓鱼邮件和一半合法邮件),展示了卓越的性能。没有外部URL信息增强时,模型的分类准确率为97.4%,ROC AUC值为0.994,表明其在区分钓鱼邮件和合法邮件方面非常准确。引入VirusTotal等外部URL情报后,分类准确率提升至99%,F1评分接近满分,进一步提高了检测的精度。然而,当外部情报信息错误时,模型的准确性会有所下降,尤其是在错误标记URL为安全的情况下,准确率下降至44.9%。即便如此,系统在检测钓鱼邮件时依然表现出较高的召回率,避免漏报。实验结果表明,结合外部威胁情报显著提升了模型的分类效果,使APOLLO成为钓鱼防护的有效工具。

图片

定性结果:在用户研究中,APOLLO生成的警告信息在多个维度上得到了积极反馈。用户普遍认为这些警告信息清晰易懂,尤其是包含详细解释的部分,帮助他们更好地理解邮件的潜在风险。相比传统的警告提示,APOLLO的解释性警告更具吸引力和可信度,用户表示这些警告能够提升他们的安全意识,并促使他们采取更为谨慎的行为。在调查中,参与者提到的常见反应包括对邮件内容的怀疑和停止交互的决定,尤其是在遇到不熟悉或可疑的链接时,许多人表示会选择不继续操作。此外,用户认为这些警告不仅帮助他们识别钓鱼邮件,还增强了他们对系统的信任感。部分用户指出警告中的某些技术术语,如“域名”和“IP地址”,略显复杂,但整体上这些警告信息显著提高了用户的风险认知水平。

图片

论文结论

本论文的贡献在于提出了一个基于LLM的网络钓鱼防护工具APOLLO,并展示了其在邮件分类和生成解释信息方面的有效性。通过实验验证,APOLLO在检测和解释网络钓鱼邮件方面表现出色,能够显著提升用户对安全威胁的感知能力。未来的研究将进一步优化系统,并探索LLMs在网络安全领域的更多应用。

原作者:论文解读智能体

校对:小椰风

图片


http://www.ppmy.cn/devtools/131837.html

相关文章

卫星授时服务器,单北斗授时服务器,北斗卫星时钟服务器

当前NTP授时服务器已经实现内部的元器件及芯片实现采用国产化,已经证明了国产产品已经摆脱需要依靠进口元器件及芯片才能实现的产品研发、也证明了大国崛起。下来我们来分析下国产化服务器具备的优势。 1、采用国产操作系统:使用国产化系统Linux更加可靠…

RAR解压软件推荐:最适合你的工具与使用技巧

在当今数字化时代,无论是在工作还是生活中,我们经常会接触到各种文件格式,而 RAR 格式文件因其出色的压缩性能和多功能性被广泛使用。 在工作场景中,许多软件的安装包、大型文档资料等常常以 RAR 格式进行分发和存储。 例如&…

(八)JavaWeb后端开发——Tomcat

目录 1.Web服务器概念 2.tomcat 1.Web服务器概念 服务器:安装了服务器软件的计算机服务器软件:接收用户的请求,处理请求,做出响应web服务器软件:在web服务器软件中,可以部署web项目,让用户通…

【ARM Linux 系统稳定性分析入门及渐进 1.9.2 -- Crash 命令 System State 集合】

文章目录 Crash 工具的系统状态相关命令进程和信号相关命令内存和虚拟内存相关命令系统状态和设备相关命令Crash 工具的系统状态相关命令 以下是 crash 工具中与系统状态管理相关的一些重要命令,它们提供了详细的进程和内存状态信息: 进程和信号相关命令 ps: 提供类似于典型…

Vue.js 组件开发:构建高效、可重用的用户界面

Vue.js 组件开发:构建高效、可重用的用户界面 Vue.js 是一个流行的 JavaScript 框架,它致力于通过简单的 API 和高度响应的设计,帮助开发者构建高效、动态的前端应用。在 Vue.js 中,组件是构建用户界面的核心单元。它们使得应用的…

分布式缓存

一、引言 在当今互联网时代,随着业务的不断发展和用户量的持续增长,系统的性能和可扩展性成为了关键挑战。分布式缓存作为一种重要的技术手段,能够有效地缓解数据库压力、提高系统响应速度、增强系统的可扩展性。本文将全面介绍分布式缓存的相…

【JS学习】08. web API-事件进阶

Web APIs - 第3天 进一步学习 事件进阶,实现更多交互的网页特效,结合事件流的特征优化事件执行的效率 掌握阻止事件冒泡的方法理解事件委托的实现原理 事件流 事件流是对事件执行过程的描述,了解事件的执行过程有助于加深对事件的理解&…

【软考网工笔记】网络基础理论——物理层

文章目录 贝尔系统 T1 载波光纤 - SFP接口差分&&曼彻斯特编码网桥MAC-in-MACQ-in-QIPv6的链路本地地址CRC校验与计算E1载波编码效率对称xDSL坚持算法-CSMAUDP头部字段万兆以太网标准 IEEE 802.3ae海明码-纠错码ARP帧中的目标MAC地址快速以太区网物理层标准 100BASE-TXM…