通过 API 将Deepseek响应流式内容输出到前端

server/2025/3/18 14:27:44/

要实现通过 API 将流式内容输出到前端,可以采用以下技术方案(以 Python 后端 + 前端 JavaScript 为例):

方案一:使用 Server-Sent Events (SSE)

这是浏览器原生支持的流式传输方案,推荐首选

# Flask 示例
from flask import Response, stream_with_context@app.route('/stream')
def stream_data():def generate():response = client.chat.completions.create(model="deepseek-chat",messages=messages,stream=True)for chunk in response:if chunk.choices:content = chunk.choices[0].delta.content or ""# SSE 格式要求 data: 前缀和双换行符yield f"data: {json.dumps({'content': content})}\n\n"return Response(stream_with_context(generate()), mimetype='text/event-stream')
// 前端 JavaScript
const eventSource = new EventSource('/stream');eventSource.onmessage = (event) => {const data = JSON.parse(event.data);document.getElementById('output').innerHTML += data.content;
};eventSource.onerror = (err) => {console.error('EventSource failed:', err);eventSource.close();
};

方案二:使用流式 HTTP 响应(NDJSON)

更通用的流式传输方案,适合非浏览器客户端

# FastAPI 示例
from fastapi import APIRouter
from fastapi.responses import StreamingResponse
import json@app.get("/stream")
async def stream_data():async def generate():response = client.chat.completions.create(model="deepseek-chat",messages=messages,stream=True)async for chunk in response:if chunk.choices:content = chunk.choices[0].delta.content or ""yield json.dumps({"content": content}) + "\n"  # NDJSON 格式return StreamingResponse(generate(), media_type='application/x-ndjson')
// 前端 JavaScript 使用 Fetch API
async function streamData() {const response = await fetch('/stream');const reader = response.body.getReader();const decoder = new TextDecoder();while(true) {const { done, value } = await reader.read();if(done) break;const chunk = decoder.decode(value);const data = JSON.parse(chunk);document.getElementById('output').innerHTML += data.content;}
}

关键配置说明

  1. 响应头设置

    # Flask
    headers = {'Cache-Control': 'no-cache','Connection': 'keep-alive'
    }# FastAPI 自动处理
    
  2. 数据格式选择

    • SSE (text/event-stream):浏览器原生支持,自动重连
    • NDJSON (application/x-ndjson):更通用的流式 JSON 格式
    • 纯文本流:简单但结构化能力弱
  3. 前端处理建议

    // 更健壮的读取方式(处理分块不完整情况)
    let buffer = '';async function processChunk(chunk) {buffer += chunk;while(buffer.includes('\n')) {const lineEnd = buffer.indexOf('\n');const line = buffer.slice(0, lineEnd);buffer = buffer.slice(lineEnd + 1);try {const data = JSON.parse(line);// 处理数据...} catch(e) {console.error('解析错误:', e);}}
    }
    

完整工作流程示例(FastAPI + React)

后端

# main.py
from fastapi import FastAPI
from fastapi.middleware.cors import CORSMiddlewareapp = FastAPI()app.add_middleware(CORSMiddleware,allow_origins=["*"],allow_methods=["*"],allow_headers=["*"],
)@app.get("/chat")
async def chat_stream(prompt: str):async def generate():response = client.chat.completions.create(model="deepseek-chat",messages=[{"role": "user", "content": prompt}],stream=True)async for chunk in response:if content := chunk.choices[0].delta.content:yield json.dumps({"content": content})return StreamingResponse(generate(), media_type="application/x-ndjson")

前端 React 组件

// ChatComponent.jsx
import { useState } from 'react';export default function ChatComponent() {const [output, setOutput] = useState('');const startStream = async () => {const response = await fetch('http://api/chat?prompt=你好');const reader = response.body.getReader();const decoder = new TextDecoder();let buffer = '';while(true) {const { done, value } = await reader.read();if(done) break;buffer += decoder.decode(value);while(buffer.includes('}')) {const endIndex = buffer.indexOf('}') + 1;const chunk = buffer.slice(0, endIndex);buffer = buffer.slice(endIndex);try {const data = JSON.parse(chunk);setOutput(prev => prev + data.content);} catch(e) {console.error('解析错误:', e);}}}};return (<div><button onClick={startStream}>开始对话</button><div id="output">{output}</div></div>);
}

注意事项

  1. 连接管理

    • 设置合理的超时时间(通常 30-60 秒)
    • 处理客户端提前断开连接的情况
    # FastAPI 示例
    try:async for chunk in response:# ...处理数据if await request.is_disconnected():break
    finally:await client.close()  # 清理资源
    
  2. 性能优化

    • 使用异步框架(FastAPI 性能优于 Flask)
    • 启用响应压缩
    app = FastAPI()
    @app.middleware("http")
    async def add_compression(request, call_next):response = await call_next(request)response.headers["Content-Encoding"] = "gzip"return response
    
  3. 安全考虑

    • 限制最大并发连接数
    • 实施速率限制
    from fastapi import Request
    from fastapi.middleware import Middleware
    from slowapi import Limiter
    from slowapi.util import get_remote_addresslimiter = Limiter(key_func=get_remote_address)
    app.state.limiter = limiter@app.get("/chat")
    @limiter.limit("10/minute")
    async def chat_stream(request: Request):# ...
    
  4. 错误处理增强

    async def generate():try:response = client.chat.completions.create(...)async for chunk in response:# 处理数据...except Exception as e:yield json.dumps({"error": str(e)})finally:await client.close()  # 确保释放资源
    

这些方案可根据具体需求组合使用,建议优先选择 SSE 方案(浏览器兼容性好),需要支持更复杂场景时可考虑 WebSocket,但后者实现成本较高。


http://www.ppmy.cn/server/175980.html

相关文章

Unity特效动态合批问题

关于Unity 特效粒子的自动合批 - Storm_Spirit - 博客园 设置缓冲区CBUFFER

原生微信小程序实现导航漫游(Tour)

效果&#xff1a; 小程序实现导航漫游 1、组件 miniprogram/components/tour/index.wxml <!--wxml--> <view class"guide" wx:if"{{showGuide}}"><view style"{{guideStyle}}" class"guide-box"><view class&quo…

CAN总线的CC帧和FD帧之间如何仲裁

为满足CAN总线日益提高的带宽需求&#xff0c;博世公司于2012年推出CAN FD&#xff08;具有灵活数据速率的CAN&#xff09;标准&#xff0c;国际标准化组织&#xff08;ISO&#xff09;2015年通过ISO 11898-1:2015标准&#xff0c;正式将CAN FD纳入国际标准&#xff0c;以示区别…

Linux第六讲----git与gdb

1.创建仓库并上传代码 打开gitee,新建仓库 按下图操作&#xff1a;之后点创建 在点击橙色的克隆下载&#xff1a;并复制 之后登录xshell并进入家目录 输入git clone 右键粘贴 如下图所示 之后我们进入for_delete cd for_delete/ 创建一个文件&#xff0c;code.c,输入如下内…

2024年第十五届蓝桥杯软件C/C++大学A组——五子棋对弈

蓝桥杯原题&#xff1a; 题目描述&#xff1a; “在五子棋的对弈中&#xff0c;友谊的小船说翻就翻&#xff1f; ” 不&#xff01;对小蓝和小桥来说&#xff0c;五子棋不仅是棋盘上的较量&#xff0c;更是心与心之间的沟通。这两位挚友秉承着 “ 友谊第一&#xff0c;比赛第二…

WebSocket和长轮询

WebSocket 原理与实现 原理 WebSocket 是一种在单个TCP连接上进行全双工通信的协议。它允许服务器主动向客户端推送数据&#xff0c;而不需要客户端发起请求。一旦连接建立&#xff0c;客户端和服务器可以随时互相发送消息。 握手阶段&#xff1a;客户端通过HTTP请求升级到W…

告别数据库束缚!用esProc在 csv 文件上执行 SQL

esProc SPL 支持简单 SQL&#xff0c;可以直接在 csv 等结构化文本文件上执行 SQL 语句&#xff0c;这样&#xff0c;不用数据库也可以用 SQL 计算了。 先下载 esProc SPL&#xff1a;免费下载 不想折腾源代码的话&#xff0c;可以用标准版&#xff0c;找到相应版本下载后安装…

用 Vue 3.5 TypeScript 重新开发3年前甘特图的核心组件

回顾 3年前曾经用 Vue 2.0 开发了一个甘特图组件&#xff0c;如今3年过去了&#xff0c;计划使用Vue 3.5 TypeScript 把组件重新开发&#xff0c;有机会的话再开发一个React版本。 关于之前的组件以前文章 Vue 2.0 甘特图组件 下面录屏是是 用 Vue 3.5 TypeScript 开发的目前…