meta-llama/Meta-Llama-3-8B

devtools/2024/10/16 0:17:29/

https://huggingface.co/meta-llama/Meta-Llama-3-8B

型号细节

Meta开发并发布了Meta Llama 3家族大型语言模型(LLM),这是一组预训练和指令微调的生成性文本模型,大小为8B和70B参数。Llama 3指令微调模型针对对话用例进行了优化,在常见的行业基准测试中表现优于许多可用的开源聊天模型。此外,在开发这些模型时,我们非常谨慎地优化了有用性和安全性。

模型开发者 Meta

变体 Llama 3有两种尺寸 - 8B和70B参数 - 预训练和指令微调变体。

输入 模型只接受文本输入。

输出 模型只生成文本和代码。

模型架构 Llama 3是一种自回归语言模型,使用优化的transformer架构。经过调整的版本使用监督fine-tuning(SFT)和人工反馈强化学习(RLHF)来实现有用性和安全性方面的人类偏好对齐。

模型训练数据参数量上下文长度是否使用GQA标记计数知识截止日期
Llama 3新的公开在线数据组合8B8k15T+2023年3月
Llama 3新的公开在线数据组合70B8k2023年12月

Llama 3系列模型。标记计数仅指预训练数据。8B和70B版本都使用Grouped-Query Attention(GQA)来提高推理可扩展


http://www.ppmy.cn/devtools/4584.html

相关文章

Youtube DNN

目录 1. 挑战 2. 系统整体结构 3.召回 4. 排序 5. 训练和测试样本的处理 1. 挑战 (1)规模。很多现有的推荐算法在小规模上效果好,但Youtobe规模很大。 (2)新颖度。Youtobe语料库是动态的,每秒都会有…

你的RPCvs佬的RPC

一、课程目标 了解常见系统库的hook了解frida_rpc 二、工具 教程Demo(更新)jadx-guiVS CodejebIDLE 三、课程内容 1.Hook_Libart libart.so: 在 Android 5.0(Lollipop)及更高版本中,libart.so 是 Android 运行时(ART&#x…

wx小程序-input事件改变数据

一、input标签 在index.xwml文件夹下写出input标签&#xff0c;并给它绑定一个处理函数inputTTT&#xff0c;用来改变msg的数据值。 <input value"{{msg}}" bindinput"inputTTT"/> 二、样式 和web一样&#xff0c;为了让input文本输入框好看一点…

在redhat7/8平台上部署ELK7.17.18的技术方案

部署环境说明 为节省资源直接使用1台测试机模拟3节点elasticsearch服务集群做部署&#xff0c;在该主机上同时部署了3个elasticsearch实例、1个logstash实例、1个kibana实例、1个filebeat实例。对于生产环境&#xff0c;以上实例服务应该做分布式部署。 ELK-TEST1 192.168.10…

【C++】-List经典面试笔试题总结-删除-插入-情况-合并-排序等经典操作

在C中&#xff0c;list 容器是标准模板库&#xff08;STL&#xff09;中的一种双向链表容器。以下是一些关于 list 的经典笔试面试题及解答&#xff1a; 1. list 容器的主要特点是什么&#xff1f; 解答&#xff1a; list 容器的主要特点包括&#xff1a; 它是一个双向链表结…

2024-4-19 群讨论:GraalVM 与 JVM 使用

以下来自本人拉的一个关于 Java 技术的讨论群。关注公众号&#xff1a;hashcon&#xff0c;私信进群拉你 GraalVM Native Image 的进程能否被 jps 看到&#xff1f; 感谢 dreamlike_ocean ( https://space.bilibili.com/8227104 )指正 如果编译参数里面开启了 jstat&#xff…

傅里叶变换例题

目录 傅里叶转化例题: 时移 频移 尺度 时域卷积性质:卷积==乘机

C++:运算符重载和“const”成员

hello&#xff0c;各位小伙伴&#xff0c;本篇文章跟大家一起学习《C&#xff1a;运算符重载》&#xff0c;感谢大家对我上一篇的支持&#xff0c;如有什么问题&#xff0c;还请多多指教 &#xff01; 文章目录 赋值运算符重载1. 运算符重载2.赋值运算符重载第一个点第二个点&…