第60期 | GPTSecurity周报

news/2024/11/9 10:30:40/

图片

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(LLM)等安全领域应用的知识。在这里,您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令(Prompts)。现为了更好地知悉近一周的贡献内容,现总结如下。

Security Papers

1. 映射你的模型:评估对抗性攻击对基于大语言模型的编程助手的影响

简介:研究者提出了一种名为"恶意编程提示"(MaPP)的攻击方式,通过在编程任务的提示中添加少量文本,诱导大语言模型(LLM)生成带有安全漏洞的代码。研究显示,即便是最先进的LLM也易受此攻击,研究者表明必须加强对LLM提示的安全防护,并严格审计由LLM辅助生成的代码。

链接:

https://arxiv.org/pdf/2407.11072

2. TALEC:通过标准划分和零次加少量次学习,教会你的大语言模型在特定领域使用内部标准进行评估

简介:本文提出了一种名为TALEC的模型评估方法。该方法允许用户自定义评估标准,并通过上下文学习(ICL)技术训练评判模型,使其能够理解和应用这些标准。研究者还探索了将零次学习与少量次学习相结合的方式,以提升评判模型对信息的关注度。此外,他们还设计了一种提示范例和工程化方法来优化和迭代这些少量次学习过程,帮助模型更深入地理解复杂的评估标准。然后,研究者将微调与ICL进行比较,发现微调可以被ICL取代。TALEC在准确反映人类偏好方面表现出色,其与人类判断的相关性在某些任务中超过了80%,甚至超越了人与人之间的相关性。

链接:

https://arxiv.org/pdf/2407.10999

3. Chain & Hash,一种大语言模型的指纹技术

简介:本文提出了一种名为Chain & Hash的新型LLM指纹识别技术,以应对大语言模型(LLMs)被盗用和滥用的问题。该技术通过生成问题和答案集,利用安全哈希技术生成指纹,确保了透明度、效率、持久性、健壮性和不可伪造性。实验表明,该技术能有效抵抗良性和恶意的模型变换,且在不同基准测试中,带指纹模型的性能与不带指纹模型相当。

链接:

https://arxiv.org/pdf/2407.10887

4. SLIP:使用权重分解保护大语言模型的知识产权  

简介:大语言模型最近在学界和业界的应用日益广泛,但随着其成为知识产权(IP),保护其免受盗窃和未授权使用的需求日益增加。尤其是在成本高昂的云部署转向边缘设备部署时,保护模型参数的安全性尤为重要。本文引入了一种名为SLIP的新型混合推理算法,旨在保护边缘部署的模型免受盗窃。SLIP通过矩阵分解技术,将模型分割为两部分,分别部署在安全但成本高和成本效益高但易受攻击的计算资源上,确保敏感的模型参数得到保护,同时保持推理的准确性和最小化延迟影响。实验结果证明了该方法的鲁棒性和有效性,使其成为保护LLMs的一个引人注目的解决方案。

链接:

https://arxiv.org/pdf/2407.10886

5. 利用大语言模型拆解混淆的可执行文件  

简介:在本文中,研究者提出了 DisasLLM,一种新颖的由 LLM 驱动的反汇编器,以克服分析混淆可执行文件的挑战。DisasLLM 由两个组件组成:一个基于 LLM 的分类器,用于确定汇编代码片段中的指令是否正确解码;以及一个反汇编策略,利用该模型对混淆的可执行文件进行端到端的反汇编。研究者在一组严重混淆的可执行文件上对 DisasLLM 进行了评估,结果表明它显著优于其他最先进的反汇编解决方案。

链接:

https://arxiv.org/pdf/2407.08924

6. eyeballvul:一个面向未来的野外漏洞基准测试

简介:研究者指出,近期大语言模型的长上下文开启了新的应用场景:让模型在整个代码库中查找安全漏洞。为评估模型在此任务上的表现,研究者引入了 eyeballvul 这一基准测试。它旨在大规模测试语言模型的漏洞检测能力,每周从开源库中发布的漏洞流获取并更新。该基准测试包含不同库中的一系列修订版本,每个修订版都关联着当时的已知漏洞列表。通过基于大语言模型的评分器,将模型返回的可能漏洞列表与每个修订版的已知漏洞列表作比较。截至 2024 年 7 月,eyeballvul 包含来自6000多个修订和5000多个代码库的24000多个漏洞,大小约 55GB。

链接:

https://arxiv.org/pdf/2407.08708


http://www.ppmy.cn/news/1500067.html

相关文章

嵌入式linux系统中压力测试的方法

在Linux环境下,确保系统各项资源充分且稳定地运行对任何系统管理员来说都至关重要。特别是在生产环境中,理解如何对系统资源进行基准测试和压力测试可以帮助预防未来的问题,同时也能够优化现有系统的性能。 在本文中,我们将探讨如何使用命令行工具来对Linux系统的CPU、内存…

Windows图形界面(GUI)-MFC-C/C++ - MFC绘图

公开视频 -> 链接点击跳转公开课程博客首页 -> ​​​链接点击跳转博客主页 目录 MFC绘图 绘图基础 CPaintDC 实例代码 MFC绘图 绘图基础 设备上下文(Device Context, DC): 设备上下文是一个Windows GDI(图形设备接口&#xff09…

Linux定时执行程序和关闭程序

cron是一个基于时间的作业调度器,可以在指定的时间运行命令。 打开终端并编辑cron任务 crontab -e定时任务 # 每天20点30分执行程序 30 20 * * * /home/user/my_program # 每天15点30分关闭程序 30 15 * * * pkill my_program定时在tmux会话中运行 已有会话中运行…

Telegram开发小程序(二)

使用Next.js app开发Telegram 小程序 小程序调用分享,并获取到分享的参数 const { webApp } useTelegram();const handleXShare useCallback(() > {if (webApp) {webApp.openTelegramLink(https://t.me/share/url?text%F0%9F%A4%91%20Get%20reach%20with%20…

FreeTDS从Linux访问Windows SqlServer数据库

提示 \color{red}{提示} 提示: 《Linux系统上安装FreeTDS》中讲述了如何安装包管理工具自带的的FreeTDS软件包。 《Linux系统上编译安装FreeTDS库文件》中讲述了如何编译FreeTDS源码,并安装。 《FreeTDS库文件在C代码中的简单应用》中介绍了一个简单的C用…

Filebeat安装部署及入门应用

前言 后续开发项目要用到 Filebeat 对日志做收集和处理。本文介绍了 ELK 技术中的 Filebeat,用于轻量级的日志收集和分析 参考资料: 视频教程:Elastic Stack(ELK)从入门到实践 官方文档:Filebeat overv…

详解yolov5和yolov8以及目标检测相关面试

一、与yoloV4相比,yoloV5的改进 输入端:在模型训练阶段,使用了Mosaic数据增强、自适应锚框计算、自适应图片缩放基准网络:使用了FOCUS结构和CSP结构Neck网络:在Backbone和最后的Head输出层之间插入FPN_PAN结构Head输出…

技术成神之路:设计模式(九)备忘录模式

介绍 备忘录模式(Memento Pattern)是一种行为设计模式,它允许在不破坏封装性的前提下捕获和恢复对象的内部状态。通过备忘录模式,可以在程序运行过程中保存和恢复对象的某个状态,从而实现“撤销”等功能。 1.定义 备忘…