LangGraph实战:构建智能文本分析流水线
1. 智能文本分析
LangGraph是基于图结构的工作流开发框架,通过节点函数和条件流转实现复杂业务逻辑。四大核心能力:
1.1 状态容器
统一管理流程执行上下文,支持JSON序列化存储
1.2 智能路由
基于条件判断实现动态分支跳转
1.3 可视化调试
自动生成Mermaid流程图,直观展示业务流程
1.4 持久化存储
支持流程状态的保存与恢复
根据自身业务自定义文本数据处理流程:
2. 环境准备
2.1 安装依赖库
python">!pip install langgraph langchain langchain-openai python-dotenv
2.2 配置API密钥
python">import os
from dotenv import load_dotenvload_dotenv()
os.environ["OPENAI_API_KEY"] = os.getenv('OPENAI_API_KEY') # 从.env加载密钥
3. 构建文本处理流水线
本案例实现文本分类->实体抽取->摘要生成的三步流水线
3.1 状态容器定义
python">from typing import TypedDict, Listclass ProcessState(TypedDict):raw_text: str # 原始文本category: str # 分类结果 entities: List[str] # 实体列表summary: str # 摘要结果
3.2 初始化大模型
python">from langchain_openai import ChatOpenAI#llm = ChatOpenAI(model="gpt-4-mini", temperature=0)# 这里把gpt替换成deepseek
llm = ChatOpenAI(base_url="https://api.deepseek.com/v1", # DeepSeek API端点model="deepseek-chat", # DeepSeek模型标识openai_api_key="sk-eddxxxxxxxxxxxxxxxxxxxx", # 替换为DeepSeek密钥max_tokens=1000