【GPT入门】第21课 langchain核心组件

ops/2025/3/16 21:00:26/

【GPT入门】第21课 langchain核心组件

  • 1. langchain 核心组件
  • 2.文档加载器 Document loader
  • 3.文档处理器
  • 3.1 langchain_text_splitters
  • 3.3 FAISS向量数据库和向量检索
      • 主要作用
      • 应用场景
  • 4. 对话历史管理

langchain__3">1. langchain 核心组件

模型 I/O 封装
LLMs:大语言模型
Chat Models:一般基于 LLMs,但按对话结构重新封装
PromptTemple:提示词模板
OutputParser:解析输出
数据连接封装
Document Loaders:各种格式文件的加载器
Document Transformers:对文档的常用操作,如:split, filter, translate, extract metadata, etc
Text Embedding Models:文本向量化表示,用于检索等操作(啥意思?别急,后面详细讲)
Verctorstores: (面向检索的)向量的存储
Retrievers: 向量的检索
对话历史管理
对话历史的存储、加载与剪裁

在这里插入图片描述

2.文档加载器 Document loader

from langchain_community.document_loaders import PyMuPDFLoaderloader = PyMuPDFLoader("llama2.pdf")
pages = loader.load_and_split()
print(pages[0].page_content)
print(len(pages))

3.文档处理器

langchain_text_splitters_32">3.1 langchain_text_splitters

from langchain_text_splitters import RecursiveCharacterTextSplitter
text_splitter = RecursiveCharacterTextSplitter(chunk_size=200,chunk_overlap=100,length_function=len,add_start_index=True
)
paragraphs = text_splitter.create_documents([pages[0].page_content])
for para in paragraphs:print(para)print('-'*20)

输出结果:

page_content='models outperform open-source chat models on most benchmarks we tested, and based on
our human evaluations for helpfulness and safety

http://www.ppmy.cn/ops/166316.html

相关文章

用人工智能程序驱动机器人工作

算法模型训练:首先,需要收集与机器人任务相关的数据,例如机器人在不同环境下的运动数据、视觉图像数据、语音指令数据等。然后,使用这些数据来训练各种人工智能算法模型,如机器学习中的决策树、支持向量机,…

Rust语言的移动应用开发

Rust语言在移动应用开发中的应用 引言 随着移动设备的普及,移动应用开发已经成为软件开发领域的一大热点。传统上,移动应用开发主要依赖于Java、Swift和Kotlin等语言。然而,近年来,Rust语言因其独特的特性逐渐受到关注&#xff…

matlab 谐波分析公式绘图

1、内容简介 matlab158-谐波分析公式绘图 2、内容说明 略 3、仿真分析 略 4、参考论文 略

Android中的Wifi框架系列

Android wifi框架图 Android WIFI系统引入了wpa_supplicant,它的整个WIFI系统以wpa_supplicant为核心来定义上层接口和下层驱动接口。 Android WIFI主要分为六大层,分别是WiFi Settings层,Wifi Framework层,Wifi JNI 层&#xff…

C++学习之动态数组和链表

1.课程回顾 2.数据结构基本概念 1.1数据结构概念 数据结构是计算机存储、组织数据的方式。数据结构是指相互之间存在一种或多种特定关系的数据元素的集合。通常情况下,精心选择的数据结构可以带来更高的运行或者存储效率。数据结构往往同高效的检索算法和索引技术有…

Hive SQL 精进系列:SUBSTR 函数的多样用法

目录 一、引言二、SUBSTR 函数基础介绍2.1 基本语法2.2 参数详解2.3 简单示例 三、SUBSTR 函数常见应用场景3.1 提取日期中的年份、月份或日期3.2 隐藏部分敏感信息 四、SUBSTR 函数高级用法4.1 结合条件判断动态截取4.2 处理复杂字符串模式 五、总结 一、引言 SUBSTR 函数是 …

特殊 IP 地址

文章目录 特殊IP地址概述受限广播地址(Limited Broadcast Address)直接广播地址(Directed Broadcast Address)多播地址(Multicast Address)环回地址(Loopback Address)本网络本主机&…

Centos 7 安装达梦数据库

一、环境准备 1. 确认操作系统的版本和数据库的版本是否一致 cat /etc/redhat-release 2. 关闭防火墙 查看防火墙状态 firewall-cmd --state 停止firewall systemctl stop firewalld.service 禁止firewall开机启动 systemctl disable firewalld.service 3. 修改文件l…