OpenAI 发布 GPT-4o 模型安全评估报告:风险等级为“中等”|TodayAI

devtools/2024/10/19 2:26:51/

<a class=OpenAI 发布 GPT-4o 模型安全评估报告:风险等级为“中等”|TodayAI" height="1026" src="https://img-blog.csdnimg.cn/img_convert/c1d626d8feeb35a60b945b573fa3e393.png" width="1200" />

OpenAI 近日发布了最新的 GPT-4o 系统卡,这是一份研究文件,详细介绍了公司在推出其最新 AI 模型之前所进行的安全措施和风险评估。根据该评估报告,GPT-4o 的总体风险等级被评定为 “中等” 。

GPT-4o 于今年 5 月首次公开发布。在其发布之前,OpenAI 邀请了一支外部的红队团队参与安全测试。这支团队由安全专家组成,负责对系统进行漏洞查找,以识别可能存在的关键风险。这样的测试在技术领域属于标准操作。红队团队的风险评估涵盖了多个方面,包括模型可能生成未经授权的声音克隆、色情及暴力内容、以及复制受版权保护的音频片段的可能性。经过详细评估,OpenAI 最终决定公开发布这些测试结果。

根据 OpenAI 自己的风险评估框架,研究人员发现 GPT-4o 的总体风险为 “中等” 。这一评级源自四个主要类别中的最高风险水平:网络安全、生物威胁、说服力和模型自主性。除了说服力风险外,其他三个类别的风险等级均被评为低风险。特别是在说服力方面,研究发现 GPT-4o 生成的一些文本样本比人类撰写的内容更具说服力,尽管总体上模型的说服能力并未显著超越人类。

OpenAI 发言人 Lindsay McCallum Rémy 在接受媒体采访时表示,此次发布的系统卡中包括了内部团队和外部测试人员的评估结果。外部测试团队列在 OpenAI 网站上,主要包括模型评估与威胁研究(METR)和 Apollo 研究,这两者都专门从事 AI 系统的风险评估。

值得注意的是,GPT-4o 系统卡并不是 OpenAI 首次发布的此类安全评估报告。此前,GPT-4、GPT-4 视觉版以及 DALL-E 3 等模型在发布前都进行了类似的安全测试,相关研究也已公开。然而,在当前时刻发布这份系统卡尤为重要。OpenAI 近来面临来自多方面的安全标准批评,尤其是来自公司内部员工和州立法者的压力。

就在 GPT-4o 系统卡发布前不久,有媒体报道了一封由参议员 Elizabeth Warren(D-MA)和众议员 Lori Trahan(D-MA)发出的公开信,信中质疑 OpenAI 如何处理内部举报者和进行安全审查。信中详细列举了多个公开的安全问题,其中包括 2023 年 OpenAI 首席执行官 Sam Altman 因董事会担忧而被短暂解职的事件,以及一位声称 “安全文化和流程已被追求产品创新所取代” 的安全主管的离职。

此外,OpenAI 在美国总统大选前夕推出这样一款功能强大的多模态模型,潜在风险不容忽视。尽管 OpenAI 强调其正在测试各种现实世界场景以防止模型被滥用,但仍然存在模型可能意外传播错误信息或被恶意行为者劫持的风险。

在这一背景下,呼吁 OpenAI 提高透明度的声音日益高涨。不仅在模型的训练数据方面(例如是否使用了 YouTube 数据进行训练),还包括在安全测试和风险评估方面。在 OpenAI 和其他主要 AI 实验室所在的加利福尼亚州,州参议员 Scott Wiener 正在推动一项旨在监管大型语言模型的法案。如果该法案通过,OpenAI 的前沿模型将在面向公众发布前,必须通过州规定的风险评估。这意味着未来的安全评估将不再仅仅依赖于 OpenAI 自身的判断。


http://www.ppmy.cn/devtools/93716.html

相关文章

HtmlUnit:探索Web自动化的强大工具

文章目录 官网链接原理基础使用1. 添加依赖2. 发送HTTP请求并解析页面 高级使用1. 模拟表单提交2. 处理JavaScript弹窗3. 异步请求处理 优点结论 HtmlUnit 是一个开源的“无头”&#xff08;headless&#xff09;浏览器&#xff0c;它模拟了浏览器环境&#xff0c;允许开发者在…

设计模式 由浅入深(待完结)

一、设计模式是什么&#xff1f; 设计模式是指在软件开发中&#xff0c;经过验证的&#xff0c;用于解决在特定环境下&#xff0c;重复出现的&#xff0c;特定问题的解决方案。 二、设计模式有哪些&#xff1f; 1. 观察者模式 定义对象间的一种一对多&#xff08;变化&#x…

Win/Mac/Linux/Andriod/IOS界面UI设计 - pyside6 - 01 基础系统框架

文章目录 写在前面一、pyside6是什么?1.1 pyside6是什么?1.2 pyside6与PyQt6的关系?怎么选?1.2.1 pyside6与PyQt6的关系1.2.2 选择指南二、创建pyside6的基础系统框架2.1 创建虚拟环境2.1.1 Python兼容性矩阵2.1.2 安装MiniConda2.1.3 使用MiniConda创建虚拟环境2.1.4 激活…

Kibana,Docker Remote Api,Kubernetes Api Server我未授权访问漏洞(附带修复方法)

一.Kibana Kibana是⼀个开源的分析与可视化平台&#xff0c;设计出来⽤于和Elasticsearch⼀起使⽤的。你可以⽤kibana搜索、查看存放在Elasticsearch中的数据。Kibana与Elasticsearch的交互⽅式是以各种不同的图表、表格、地图等直观地展示数据&#xff0c;从⽽达到⾼级的数据分…

移动设备上的交互式AI提示库

摘要&#xff1a; 本文介绍了一种新型的移动应用程序&#xff0c;该程序提供了一个丰富的AI提示库&#xff0c;用于辅助用户与AI语言模型的交互。该应用程序以其用户友好的界面和社区功能&#xff0c;为用户提供了一种新颖的学习和交流平台。 关键词&#xff1a; AI提示库&…

vue中rules自定义规则实现

html代码 定义prop"shifandiqu" <el-col :span"24"><el-form-item label"平台示范地区" style"margin-bottom: 6px;" prop"shifandiqu"><el-select v-model"form.provinceid" filterable placeho…

【LabVIEW学习篇 - 14】:信号量、集合点、事件发生

信号量 信号量技术是用来限制同时访问共享资源的数量。当访问量达到信号量设定的数量之后&#xff0c;其它任务只能等待&#xff0c;直到有任务释放访问权限。 比如打印机打印任务、银行办理业务时的叫号排队等等。 案例&#xff1a;使用信号量&#xff0c;实现两个波形图表轮…

在Web应用中播放本地文件

经验笔记&#xff1a;在Web应用中播放本地文件 引言 在Web应用开发中&#xff0c;有时需要实现一个功能&#xff0c;让用户能够选择本地文件并在网页上播放。本文将介绍一个简单的HTML和JavaScript示例&#xff0c;该示例允许用户选择 .mp4, .mp3, .wav, 和 .ogg 格式的文件&…