我们真的需要Chinese-LLaMA3本地大模型吗

news/2024/9/24 8:26:26/

LLaMA3 8B版本的表现已经能和GPT-4还有Claude3这些大佬一较高下了!想象一下70B版本得有多牛,是不是得飞上天和太阳肩并肩了?
不过,原版的LLaMA3主要是用英文世界的语料喂大的,虽然它对中文也能点头哈腰,但因为中文语料不够丰盛,所以用中文和它聊天时,它的表现就像是个刚学中文的老外,还有点懵。
现在社区里出现了好些用中文语料二次训练的LLaMA3项目,数量多得跟星星似的。这种开源社区的热情固然让人热血沸腾,但我这心里啊,就像吃了颗没熟的葡萄,有点酸溜溜的。


首先,我得打个问号,这一波Chinese-LLaMA3的训练热潮,是不是有点炒作的嫌疑?大家争先恐后地想要坐上中文版的头把交椅,但这训练质量、语料的靠谱程度、安全性啥的,真的能让人放心吗?再说了,中文语料和英文语料在知识层面是不是能无缝对接,基于训练团队的语料质量,最终的成果能否在中文上和英文一样溜?


我还有个疑问,如果LLaMA3的能力可以用分数来衡量,那是不是意味着任何团队做的中文训练,最后都得给个相同的分数?最后,我们真的非得要个中文版的LLaMA3吗?用非中文版的难道就不能满足我们的需求了?中文训练后的模型,还能不能和原版的保持同样的默契?


就我个人而言,我觉得吧,现在已经是2024年了,我们可能真的不需要一个Chinese-LLaMA3。我之前看过一篇文章,研究团队发现,用中文语料训练的模型在中文交互下的表现,还不如把中文prompt翻译成英文后再给LLaMA3来得效果好。


从感性的角度来看,这种情况也不难理解。中文世界的语料,无论是数量还是质量,都还比不上英文世界的语料。而且,中文语料训练出的结果,并不能像人脑那样,和英文语料训练出的结果直接画上等号。


那我们能不能通过优化应用架构,来达到更好的效果呢?其实,我们只需要一个中文语境下的大模型作为中间的Agent,让两个大模型手拉手,一起实现我们的目标。


在适当的开发工具中(类似各种agnent,比如coze,longchain),我们只需要搭建一个简单的workflow,里面包含三个过程节点:先把中文翻译成英文,再传给LLaMA3,最后把结果从英文翻译回中文。


这个workflow里有两个LLM,其中LLaMA3是目标模型,我们还需要一个在中英翻译方面特别强悍的大模型作为中介。根据当前的业务场景,它能提供system prompt,翻译出行业的专业术语。
在用户端,后台架构的这些变化对前端用户来说几乎是透明的,用户该怎么聊天还是怎么聊天,一点感觉都没有。但在结果的表现上,却能享受到LLaMA3的加持,变得更聪明。


基于同样的道理,将来如果出现了更强大的大模型,我们只需要替换workflow中的节点,而无需在应用后台做大规模的调整和开发。这样一来,我们就能像换衣服一样轻松地跟上时代的步伐了!


http://www.ppmy.cn/news/1438281.html

相关文章

EJB和Spring

1. EJB 1.1. 背景 功能日趋复杂的软件,如果把所有的功能实现都放在客户端,不仅代码没有安全性,部署及发布运维都会变的很复杂,所以将软件的功能实现分为客户端和服务端,服务端和客户端之间通过网络调用进行功能实现。…

vue使用海康控件开发包——浏览器直接查看海康监控画面

1、下载控件开发包 2、安装插件(双击/demo/codebase/HCWebSDKPlugin.exe进行安装) 3、打开/demo/index.html文件 4、在页面上输入你的海康监控的登录信息进行预览 如果有监控画面则可以进行下面的操作 注意:以下操作都在Vue项目进行 5、复…

vue: vscode安装扩展Volar失败(保姆级教程+图文结合)

1 vscode插件离线下载vsix文件 2.1 打开vscode插件市场地址 ​​​​​​https://marketplace.visualstudio.com/search?termvue&targetVSCode&categoryAll%20categories&sortByRelevance 2.2 搜索插件,Vue.volar 1 2.3 下载vsix文件 打开 vetur插件地址&…

ansible-copy用法

目录 概述实践 概述 ansible copy 常用用法举例 实践 # with_fileglob 是 Ansible 中的一个循环关键字,用于处理文件通配符匹配的结果 # 遍历 addons/files/*.txt文件 # dest: /data/soft/test 目录要事先存在,才能正常的copy - name: Copy configuration filescop…

关于学习 Python 的一些常见问题(0426)

文章目录 前言想学做动画!做动画!学习Python可以开发桌面应用程序吗?有什么可以自己简单地练习python的app或者小程序?python和数学建模有关系吗?或者说数学建模能用到python吗?自制电子证件照?…

【excel】常用的50个函数与基础操作(文本函数)

1. LEFT 定义:输出单元格左边的N个字符 使用: LEFT(单元格,输出几位) 2. RIGHT 定义:输出单元格右边的N个字符 使用: RIGHT (单元格,输出几位) 3…

vue-router清除url地址栏路由参数

this.reportId this.$route.query.reportCoreId; 在另一个页面得到这个id之后,刷新浏览器页面还是会存在在url地址栏中 然后再这样就可以清除地址栏路由参数了 mounted() { // 获取当前路由的查询参数 const query { ...this.$route.query }; // 删除指定的查询参数 delete …

Gradle的安装配置及使用

Gradle是一种新的构建工具,主要用于自动化地进行软件构建、测试、发布、部署和软件打包。与传统的构建工具相比,Gradle采用了一种叫做Groovy的语言,其语法与Java非常相似。 以下是Gradle的安装配置及使用的详细步骤: 一、安装配…