最适合智能体的身份认证技术：对比OpenID Connect、API keys、did:wba

智能体对身份认证技术提出了新的需求，其中最重要的一个就是互联互通，特别是让任意两个智能体都能够互联互通。

其中的原理很简单：AI必须具备获得完整上下文信息的能力，具备调用所有工具的能力，才能够作出正确的决策，采取合适的行动。现在很多厂商试图使用Computer Use方案解决这个问题。

但是我们认为这不是AI与互联网交互最高效的方式。这是让AI模仿人的方式访问互联网，AI应该用它最擅长的方式（API或通信协议）与数字世界交互。

这就涉及一个互联互通的问题：在智能体使用API或协议，与互联网或者其他智能体交互的时候，如何进行身份验证？特别进行跨平台的身份验证，以让任何智能体之间都能够进行连接。

我们在互联网上的身份账号，很多时候是不能跨平台使用的。比如你的微信账号，在钉钉系统中是无法识别的，反之亦然。

不过现在互联网也有很多跨平台的身份认证技术，比如我们常见的SSO（单点登录），你可以用你的谷歌账户登录很多网站。还有API keys，比如你可以使用OpenAI给你的key，访问OpenAI的API。下面我来简单的介绍下这两种技术，看看是否适合智能体的身份认证。

OpenID Connect (OIDC) 是一种基于 OAuth 2.0 构建的身份验证协议，它允许客户端应用程序验证用户身份，并获取用户的基本信息（如姓名、邮箱）。OIDC 在 OAuth 2.0 的基础上增加了标准化的身份层，使其更适合于登录和单点登录（SSO）场景。

OpenID Connect 官方规范。

下面我们以使用谷歌账号登录三方网站为例来介绍下OIDC的流程。谷歌OIDC官方文档地址。。

使用谷歌账号登录三方网站包括两部分，前置流程和Oauth2.0流程：

前置流程
- 注册谷歌平台账号
- 创建项目/应用
- 配置项目/应用，包括重定向URI
- 获取OAuth 2.0的client id和client secret
Oauth2.0流程（以授权码流程为例）
- 获取授权码
- 使用授权码获取access token和id token，id token中包含用户信息
- 使用access token和id token访问获取用户的详细信息（可选）。在OpenID Connect流程中，用户的详细信息可以认为是一种受保护的资源。

OpenID Connect的优点是：

站在智能体互联互通的场景看，OpenID Connect有几个不足：

API Keys（API 密钥）是用于验证应用程序或用户访问应用程序编程接口（API）的简单凭证。它是一种字符串形式的身份标识符，通常由随机生成的字母和数字组成，类似于密码的功能。它可以用于身份验证、访问控制、使用监控等场景。

使用API Keys验证用户身份的流程：

API keys的优点是：

站在智能体互联互通的场景看，API keys有几个不足：

W3C DID（Decentralized Identifier，DID）是一种新的去中心化标识符标准，旨在解决传统中心化身份管理系统的依赖性。它与2022年发布为推荐标准。规范地址：https://www.w3.org/TR/did-core/

目前已经有很多应用在使用W3C DID规范，比较知名的是最近比较火的bluesky，一个去中心化的推特应用。

did:wba是AgentNetworkProtocol（ANP）定义的一个did方法规范。它基于web基础设施，实现了去中心化的身份认证，专门针对agent之间的身份认证而设计。规范地址：did:wba方法规范。

与did:wba非常类似的业务是email：各个平台有自己的账号，但是不同平台之间能够非常简单的进行身份认证与通信。同时他们都基于web基础设施，能够支持大规模用户的同时，实现去中心化。

假设智能体A要订阅并调用智能体B的服务，身份验证以及请求流程如下：

did:wba身份验证方案的优点：

当然，did:wba也有一些缺点，最大的缺点是作为一个2022年发布的规范，基础设施不够完善，应用范围相对比较有限。不过我们也能够看到像bluesky这样的明星案例。

站在智能体身份验证的角度，对比did:wba和OpenID Connect、API keys：

总体对比如下：

对比项	did:wba	OpenID Connect	API keys
安全性	高	高	中等
复杂度	中等	高	低
交互次数	少	多	少
前置流程	简单，无需人工	复杂，需要人工	中等，需要人工
去中心化	是	否	是
应用范围	有限	广泛	广泛