meta-llama/Meta-Llama-3-8B

news/2024/9/23 23:33:30/

https://huggingface.co/meta-llama/Meta-Llama-3-8B

型号细节

Meta开发并发布了Meta Llama 3家族大型语言模型(LLM),这是一组预训练和指令微调的生成性文本模型,大小为8B和70B参数。Llama 3指令微调模型针对对话用例进行了优化,在常见的行业基准测试中表现优于许多可用的开源聊天模型。此外,在开发这些模型时,我们非常谨慎地优化了有用性和安全性。

模型开发者 Meta

变体 Llama 3有两种尺寸 - 8B和70B参数 - 预训练和指令微调变体。

输入 模型只接受文本输入。

输出 模型只生成文本和代码。

模型架构 Llama 3是一种自回归语言模型,使用优化的transformer架构。经过调整的版本使用监督fine-tuning(SFT)和人工反馈强化学习(RLHF)来实现有用性和安全性方面的人类偏好对齐。

模型训练数据参数量上下文长度是否使用GQA标记计数知识截止日期
Llama 3新的公开在线数据组合8B8k15T+2023年3月
Llama 3新的公开在线数据组合70B8k2023年12月

Llama 3系列模型。标记计数仅指预训练数据。8B和70B版本都使用Grouped-Query Attention(GQA)来提高推理可扩展


http://www.ppmy.cn/news/1426061.html

相关文章

Redis: 事务操作

文章目录 一、Redis的事务定义二、Redis事务的操作方式三、Redis事务三特性四、事务冲突问题五、使用场景 一、Redis的事务定义 Redis事务是一组命令的集合,这些命令会作为一个单独的执行单位进行执行。在执行事务期间,其他客户端发送的命令不能被插入到…

【重生之我在学Android原生】Media3

前言 内容颇多,尽量从简 ExoPlayer使用 官方文档 参考文章 实现效果 Android(java) 使用ExoPlayer播放视频,自定义ExoPlayer界面,记录播放位置(横屏竖屏切换/切换至后台等) 案例实现 创建…

【人工智能基础】状态空间搜索

状态空间法 状态空间:一个问题全部可能的状态以及其关系的集合。 状态空间图:以图的形式表示问题的状态空间,节点对应状态,边对应状态转移算子,边上的权对应转移所需的代价 问题的解:是从最开始状态到目…

AOP基础

一、AOP概述 AOP:Aspect Oriented Programming(面向切面编程、面向方面编程),其实就是面向特定方法编程。 使用场景:①记录操作日志;②权限控制;③事务管理等。 优势:①代码无侵入…

Docker(十):Redis三主三从(扩容、缩容)

一:启动6台Redis # privilegedtrue 获取宿主机root权限 # --cluster-enabled yes 开启redis集群 # --appendonly yes 开启持久化 docker run -d --name redis-node-1 --net host --privilegedtrue -v /data/redis/share/redis-node-1:/dataredis:6.0.8--cluster-en…

费曼物理学讲义官网

费曼物理学讲义的官网,https://www.feynmanlectures.caltech.edu/ 网页做的很好,网速也快。

docker run启动一个开发备忘清单速查表 —— 筑梦之路

docker run -itd --name reference -p 3000:3000 registry.cn-beijing.aliyuncs.com/deanmr/reference:latest包含:运维,前端,后端,工具,命令,数据库 部分截图展示:

全新付费进群系统源码 带定位完整版 附教程

搭建教程 Nginx1.2 PHP5.6-7.2均可 最好是7.2 第一步上传文件程序到网站根目录解压 第二步导入数据库(dkewl.sql) 第三步修改/config/database.php里面的数据库地址 第四步修改/config/extra/ip.php里面的域名 第四步设置伪静态thinkphp 总后台账…