类 ChatGPT 开源软件,开发者用的上吗?

news/2024/10/21 7:37:43/

声明:本文是 Preethi Cheguri 所著文章《ChatGPT Equivalent Is Open-Source, But it Is of No Use to Developers》的中文译文。

原文链接:https://www.analyticsinsight.net/chatgpt-equivalent-is-open-source-but-it-is-of-no-use-to-developers/

类似于 ChatGPT 的软件现已开源,但这似乎对开发者们来说无用

第一个类似于 ChatGPT 的开源软件已经出现:这是一款基于谷歌 5,400 亿个参数的语言大模型 PaLM 架构,以及使用 RLHF(Reinforcement Learning from Human Feedback,即:使用强化学习的方法,利用人类反馈信号直接优化语言模型)的应用程序。“PaLM + RLHF” 复刻了 ChatGPT,并且现在已经开源,它是由负责逆向工程闭源 AI 系统(比如 Meta 发布的 Make-A-Video)的开发者,开发出来的一个功能类似于 ChatGPT 的文本生成模型。为了构建一个几乎可以完成 ChatGPT 任何任务的系统,包括起草电子邮件和代码提示,该系统结合了谷歌的语言大模型 PaLM 以及人类反馈强化学习(RLHF)的方法。

为什么这个“开源 ChatGPT”对开发人员没有用?

“PaLM + RLHF” 未经过预训练,换句话说:系统还没有接受网络上示例数据的必要训练,使其真正发挥作用。下载 “PaLM + RLHF” 后的体验感和使用 ChatGPT 时并不一致,“PaLM + RLHF” 需要生成该模型可以学习的千兆字节文本,然后找到能够处理训练需求的硬件。这是一个非常昂贵的过程,除非有资金雄厚的企业(或个人)专门去研究并供公众使用,否则 “PaLM + RLHF” 目前还无法取代 ChatGPT。

好消息是,复刻 ChatGPT 的其他几个项目发展迅速,包括研究团队 CarperAI 运营的项目。CarperAI 将与 OpenAI 研究小组 EleutherAI、初创公司 Scale AI 和 Hugging Face 合作,发布第一个由人类反馈训练的 “类-ChatGPT 即用型 AI 模型”。非营利组织 LAION 率先开展了一个使用最新的机器学习方法来复刻 ChatGPT 的项目,LAION 也为训练 Stable Diffusion 提供了初始数据集。那么使用了 RLHF 的 PaLM 应用程序能够做些什么?随着模型规模的扩大,跨活动的性能不断提高,新的机会也将出现。PaLM 可扩展到 5,400 亿个参数,相比之下,GPT-3 大约只有 1,750 亿个参数。

“ChatGPT” 与 “PaLM + RLHF”

带有人类反馈的强化学习是一种旨在更好地将语言模型与用户期望的目标保持一致的方法,同时也是 ChatGPT 与 “PaLM + RLHF” 都拥有的秘密武器。RLHF 需要使用包含提示的数据集微调语言模型,且该提示与人类志愿者预期模型将要表达的内容相匹配,例如:提示 “向 6 岁孩子解释机器学习”;回答 “机器学习是 AI 的一种形式……”。

“PaLM + RLHF” 中使用了 PaLM 语言模型。在反馈上述提示到改进后的模型中,由此生成多个回应,志愿者将每个回应由好到差进行排名,然后使用该排名来训练 “奖励模型”,此模型采用原始模型的回应并按偏好顺序对它们进行排序,然后过滤出给定提示的最佳答案。收集训练数据这个过程非常昂贵。

此外,训练过程也不便宜。PaLM 有 5,400 亿参数/语言模型组件,这些都是从训练数据中所习得的。而 2020 年的一项研究表明,开发一个只有 15 亿个参数的文本生成模型的费用可能高达 160 万美元。耗时三个月,训练了拥有 1,760 亿个参数的开源模型 Bloom,用了 384 个 Nvidia A100 GPU(每一个需要数千美金)。而运行 “PaLM + RLHF” 大小的训练模型同样也不简单。Bloom 需要配备装有大约八个 A100 GPU 的专用 PC。每年估计在单个的亚马逊网站服务实例上,运行 OpenAI 的文本生成 GPT-3(包含超过 1,750亿 个参数)的成本约为 87,000 美元。

结论:除非有资金雄厚的企业(或个人)投入训练,并公之于众,否则 “PaLM + RLHF” 目前还无法取代 ChatGPT。


免责声明:本文提供的信息仅代表作者/广告商的意见,而非投资建议——仅用于教育目的。通过阅读本文,文中信息并不构成 Analytics Insight 及团队的任何投资或财务建议。投资者应该寻求自己的独立财务或专业建议。在做出任何投资决定之前,请与财务顾问一起进行独立研究。Analytics Insight 和团队不对本文中提供的投资观点负责。


开源雨林围绕开源通识、开源使用、开源贡献三大方面构建知识体系,愿把长期积累的经验系统化分享给企业,在团队、机制、项目三方面提供合作,推动各企业更高效地使用开源、贡献开源,提升全行业开源技术与应用水平。

开源雨林的内容已开源,并托管在 https://github.com/opensource-rainforest ,欢迎通过 Pull Request 的形式贡献内容,通过 Issue 的形式展开讨论,共同维护开源雨林的内容。

欢迎关注“开源雨林”公众号,获取最新、最全的消息。


http://www.ppmy.cn/news/951291.html

相关文章

全球最大的 ChatGPT 开源替代品来了,支持 35 种语言,网友:不用费心买 ChatGPT Plus了!...

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) 自去年 11 月 ChatGPT 面向公众测试以来,OpenAI 一直占据各大科技网站的头版头条,以及成为很多开发者工具的首选。ChatGPT 的落地不仅仅可以提供代码建议、总结长文本、回答问题…

全球最大的 ChatGPT 开源替代品来了!

本周赠书:《Elasticsearch数据搜索与分析实战》 出品 | CSDN(ID:CSDNnews)、整理 | 屠敏 自去年 11 月 ChatGPT 面向公众测试以来,OpenAI 一直占据各大科技网站的头版头条,以及成为很多开发者工具的首选。C…

全球最大ChatGPT开源平替来了!支持35种语言,写代码、讲笑话全拿捏

转载自 | 新智元 编辑 | 桃子 拉燕 【导读】刚刚,LAION发布了世界最大ChatGPT开源平替——OpenAssistant。网友上手实测后,纷纷表示这是开源的胜利。世界最大的ChatGPT平替来了! OpenAssistant是一个开源的对话模型,基于Pythia和L…

中科院学术科研专用版 ChatGPT开源,斩获24.5K star

点击“开发者技术前线”,选择“星标” 让一部分开发者看到未来 来自:新智元 最近,一位开发者在GitHub上开源的「科研工作专用ChatGPT」项目大受好评。论文润色、语法检查、中英互译、代码解释等等一键搞定。这个项目就是「中科院学术专业版 C…

ChatGPT开源模型3.5 API调用示例

调用开源api POSTMAN 这里我用的是postman,主要看请求头、body 、其它工具语言都是一致的 参数说明 地址 : https://api.openai.com/v1/chat/completions 请求方式 :post 请求头 : application/json Content-Type:ap…

ChatGPT 开源了第一款插件,都来学习一下源码吧!

3 月 23 日,OpenAI 又投出了一枚重磅炸弹:为 ChatGPT 推出插件系统! 此举意味着 ChatGPT 将迎来“APP Store”时刻,也就是围绕它的能力,形成一个开发者生态,打造出基于 AI 的“操作系统”! 插…

ChatGPT开源替代来了!参数量200亿,在4300万条指令上微调而成

OpenChatKit 是一个类 ChatGPT 开源工具包,内含一个 20B 参数量的大模型,而且该模型在 4300 万条指令上进行了微调。 转自《机器之心》 2023 年,聊天机器人领域似乎只剩下两个阵营:「OpenAI 的 ChatGPT」和「其他」。 ChatGPT 功能…

ChatGPT开源平替来了,开箱即用!前OpenAI团队打造,GitHub刚发布就揽获800+星

点击上方“视学算法”,选择加"星标"或“置顶” 重磅干货,第一时间送达 丰色 发自 凹非寺量子位 | 公众号 QbitAI ChatGPT的开源平替来了,源代码、模型权重和训练数据集全部公开。 它叫OpenChatKit,由前OpenAI研究员共同…