大模型学习笔记 - LLM 之 LLaMA系列(待更新)

embedded/2024/10/18 14:23:56/
  • LLaMA 系列
    • LLaMA 概述
      • LLaMA-1
      • LLaMA-2
      • LLaMA-3

LLaMA 概述

LLaMA: Open and Efficient Foundation Language Models
Llama 2: Open Foundation and Fine-Tuned Chat Models (LLama2 & LLama2-Chat)
LLama 3 | LLama 3.1

LLaMA-1

涉及到的基础知识点:

  1. pre-normalization. RSMNorm。
  2. SwiGLU activation function [PaLM].
  3. Rotary Embeddings [GPTNeo].Rotary positional embeddings (RoPE),
  4. FlashAttention

LLaMA-2

涉及到的基础知识点:

  1. groupAttention
  2. RLHF(PPO,拒绝采样)

LLama2:
我们还将预训练语料库的大小增加了 40%,增加了模型的上下文长度,并采用分组查询注意力(Ainslie et al., 2023)。我们正在发布具有 7B、13B 和 70B 参数的 Llama 2 变体。

LLama2Chat:
Llama 2-Chat 的训练:这个过程始于使用公开可用的在线源对 Llama 2 进行预训练。接下来,我们通过应用监督微调来创建 Llama 2-Chat 的初始版本。随后,使用带有人类反馈 (RLHF) 方法的强化学习迭代地改进模型,特别是通过拒绝采样近端策略优化 (PPO)。在 RLHF 阶段,迭代奖励建模数据与模型增强并行的累积对于确保奖励模型保持在分布内至关重要。

在这里插入图片描述

LLaMA-3


http://www.ppmy.cn/embedded/101718.html

相关文章

helm安装jenkins保姆级别

一、创建nfs服务器 这一步跳过、自行百度 注意:要给共享目录赋予权限chmod一下,不然到时候容器没办法在目录里面创建文件,初始化时候会报错误代码2 二、添加Jenkins的Helm仓库 helm repo add jenkinsci https://charts.jenkins.io helm re…

Softmax函数防止溢出,稳定计算

Softmax函数 用户: cv::Mat softmax(const cv::Mat& src) {CV_Assert(src.type() CV_32FC1); // 确保输入矩阵是单通道的32位浮点类型for (auto i 0; i < src.rows; i) {cv::Mat singleRow src.row(i);double max;cv::minMaxLoc(singleRow, NULL, &max, NULL, …

安卓中 onClick(View v) 方法在主线程还是子线程运行

在Android开发中&#xff0c;onClick(View v) 方法通常是在主线程&#xff08;也称为UI线程&#xff09;中运行的。这个方法是在用户与界面元素&#xff08;如按钮&#xff09;进行交互时&#xff0c;由系统框架自动调用的。由于Android的UI操作必须是线程安全的&#xff0c;并…

力扣面试经典算法150题:除自身以外数组的乘积

除自身以外数组的乘积算法详解 今天的题目是力扣面试经典150题中的数组的中等难度题&#xff1a;除自身以外数组的乘积。 题目链接&#xff1a;https://leetcode.cn/problems/product-of-array-except-self/description/?envTypestudy-plan-v2&envIdtop-interview-150 …

C++对比C语言新的赋值

1.int a(10);//int a10;只能用于初始化不能运用于再次赋值 2.int a{b};//ab; 3.键盘输入cin&#xff1a; 可以使用cin把用户在命令行中的内容赋值到变量中。 空格也算是字符&#xff1b; string str; // C的字符串是string cin>>str>>endl; // 接收键盘输入&am…

【模型】Temporal Fusion Transformer (TFT) 模型

Temporal Fusion Transformer (TFT) 模型是一种专为时间序列预测设计的高级深度学习模型。它结合了神经网络的多种机制来处理时间序列数据中的复杂关系。TFT 由 Lim et al. 于 2019 年提出&#xff0c;旨在处理时间序列中的不确定性和多尺度的依赖关系。 一、TFT模型的核心组成…

laravel “Class \“Redis\“ not found“ 如何解决?

laravel “Class “Redis” not found” 如何解决 问题&#xff1a;laravel 安装好后&#xff0c;运行报错提示&#xff1a;“Class “Redis” not found” 分析&#xff1a;程序并没有用到redis&#xff0c;百度了一下&#xff0c;初步锁定可能是php环境的原因&#xff0c;运…

基于微信小程序的外卖订餐系统设计与实现

外卖| 订餐小程序| 外卖订餐小程序 博主介绍&#xff1a;✌️大家好&#xff01;我是Coder-coco&#xff0c;一名专注以理论为基础、实战为主的技术博主&#xff0c;本人在Java毕业设计领域有多年的经验&#xff0c;陆续会更新更多优质的Java实战项目&#xff0c;希望你能有所收…