【大模型(LLMs)RAG 检索增强生成 面经】

embedded/2025/3/16 14:08:07/

RAG__0">1 RAG 基础面

1.1 为什么大模型需要外挂 (向量) 知识库?

如何将外部知识注入大模型,最直接的方法:利用外部知识对大模型进行微调。
思路: 构建几十万量级的数据,然后利用这些数据 对大模型进行微调,以将 额外知识注入大模型
优点: 简单粗暴
缺点:
这几十万量级的数据 并不能很好的将额外知识注入大模型;
训练成本昂贵。不仅需要 多卡并行,还需要 训练很多天;
既然大模型微调不是将外部知识注入大模型的最优方案,那是否有其它可行方案?

RAG__10">1.2. RAG 思路是怎么样?

⚫ 加载文件
⚫ 读取文本
⚫ 文本分割
⚫ 文本向量化
⚫ 问句向量化
⚫ 在文本向量中匹配出与问句向量最相似的 top k 个
⚫ 匹配出的文本作为上下文和问题一起添加到 prompt 中
⚫ 提交给 LLM 生成回答

在这里插入图片描述


http://www.ppmy.cn/embedded/173077.html

相关文章

机器学习之线性代数

文章目录 一、引言:线性代数为何是AI的基石二、向量:AI世界的基本构建块(一)向量的定义(二)向量基础操作(三)重要概念 三、矩阵:AI数据的强大容器(一&#xf…

大模型训练全流程深度解析

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。https://www.captainbed.cn/north 文章目录 1. 大模型训练概览1.1 训练流程总览1.2 关键技术指标 2. 数据准备2.1 数据收集与清洗2.2 数据…

Xcode16 Archive Error - Command SwiftCompile failed with a nonzero exit code

1.打包错误信息 Command SwiftCompile failed with a nonzero exit code 2.找到原因 It’s because in Xcode 16, UITextField, they add a new function with the same name onReturn. It’s ok when you compile and run, but will return error DeadArgSignatureOpt when…

探索Maas平台与阿里 QWQ 技术:AI调参的魔法世界

摘要:本文介绍了蓝耘 Maas 平台在人工智能领域的表现及其核心优势,包括强大的模型支持、高效的资源调度和友好的操作界面。文章还探讨了蓝耘 Maas 平台与阿里 QWQ 技术的融合亮点及应用拓展实例,并提供了调参实战指南,最后对蓝耘 …

《CircleCI:CircleCI:解锁软件开发持续集成(CI)和持续部署(CD)高效密码》:此文为AI自动生成

《CircleCI:CircleCI:解锁软件开发持续集成(CI)和持续部署(CD)高效密码》:此文为AI自动生成 一、CircleCI 初印象 在当今软件开发的快节奏赛道上,持续集成(CI&#xff…

oracle 中创建 socket客户端 监听数据库变动,返回数据给服务端!!!

目录 socket客户端Java代码 函数触发器1、触发器2、 函数3、 java 代码1、socket 5-1 socket 服务端 socket客户端Java代码 函数触发器 (当数据库数据变动是触发socket客户端代码,将信息发送到服务端)应用场景 ---- 第三方往中间库导入数据&…

整数分段c++

题目描述 小 Z 有一个大整数 s,整数 s 的位数最大可能有 100 位。现在小 Z 将要将这个整数 s 分成若干段,至少两段。 问是否存在一种分段方法,可以使得分段后的每一段整数的各个数位之和相同。 「注意」 本题中的大整数 s 比较特殊&#…

蓝桥杯省赛真题C++B组-2024好数

一、题目 问题描述 一个整数如果按从低位到高位的顺序,奇数位 (个位、百位、万位 ⋯⋯ ) 上的数字是奇数,偶数位 (十位、千位、十万位 ⋯⋯ ) 上的数字是偶数,我们就称之为 “好数”。 给定一个正整数 N,请计算从 1 到 N 一共有多…