本地部署项目记录【deepseek、QWQ】

embedded/2025/3/11 5:08:43/

1-DeepSeek

参考:【Deepseek】Linux 本地部署 Deepseek_linux部署deepseek-CSDN博客

问题:

(base) root@QiuKu_303:~/Documents/Ollama# sh ollama_install.sh >>> Cleaning up old version at /usr/local/lib/ollama >>> Installing ollama to /usr/local >>> Downloading Linux amd64 bundle ######################################################################### 100.0%

解决:【跳过问题】

export LD_LIBRARY_PATH=/usr/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH


2-QWQ-32B

参考:消费级显卡也能跑!QwQ-32B本地部署教程来了!【视频号】

参考:Linux环境下使用vLLM部署本地大模型_vllm加载本地模型-CSDN博客

参考:DeepSeek 部署指南 (使用 vLLM 本地部署)_vllm部署deepseek-CSDN博客

conda create -n QWQ-32B python=3.12
pip install vllm
pip install git+https://github.com/huggingface/transformers
pip install modelscope
modelscope download --model 'Qwen/QwQ-32B' --local_dir '目标目录'
vllm serve /home74/liguangzhen/folder/QwQ-32B

方案 1:使用 vLLM 部署 DeepSeek

vLLM 具有高吞吐量,支持 PagedAttention,高效利用多张 GPU。

1. 安装 vLLM

pip install vllmpip install modelscope

2. 下载 DeepSeek 模型

拉取 DeepSeek 相关模型,例如:# 以 deepseek-ai/deepseek-llm-7b-chat 为例

modelscope download --model 'deepseek-ai/deepseek-llm-7b-chat' --local_dir '/home74/liguangzhen/folder/DeepSeek'

3. 启动 vLLM 服务器

python -m vllm.entrypoints.openai.api_server \--model deepseek-7b-chat \--tensor-parallel-size 4  # 4 张 GPU 进行张量并行
  • tensor-parallel-size 设为 4,可以让 4 张 3090 共同运行一个模型。

启动后,API 服务会运行在 http://localhost:8000/v1/completions,可以用 OpenAI API 兼容方式调用。

4. 测试 API

import requestsurl = "http://localhost:8000/v1/completions"
headers = {"Content-Type": "application/json"}
data = {"model": "deepseek-7b-chat","prompt": "请介绍一下深度学习。","max_tokens": 200
}response = requests.post(url, headers=headers, json=data)
print(response.json())


http://www.ppmy.cn/embedded/171679.html

相关文章

MyBatis-Plus 与 Spring Boot 的最佳实践

在现代 Java 开发中,MyBatis-Plus 和 Spring Boot 的结合已经成为了一种非常流行的技术栈。MyBatis-Plus 是 MyBatis 的增强工具,提供了许多便捷的功能,而 Spring Boot 则简化了 Spring 应用的开发流程。本文将探讨如何将 MyBatis-Plus 与 Spring Boot 进行整合,并分享一些…

WPF基础知识61-80

数据访问与处理 61.如何在 WPF 应用程序中使用 ADO.NET 进行数据库访问? 答案:首先需要引用 System.Data.SqlClient(针对 SQL Server 数据库,若为其他数据库需引用相应的库)。然后创建数据库连接对象,根据…

MySQL优化系列13-MySQL8.0 表连接方法简介

备注:测试数据库版本为MySQL 8.0 一. Nested Loop Join算法 1.1 普通的Nested Loop Join算法 将外层表的结果集作为循环的基础数据,然后循环从该结果集每次一条获取数据作为下一个表的过滤条件去查询数据,然后合并结果。如果有多个表join,那么…

DeepSeek 与 ChatGPT的主要区别

DeepSeek 是由中国公司 DeepSeek AI (杭州深度求索人工智能基础技术研究有限公司)开发的 AI 聊天机器人,于 2024 年推出。相比之下,ChatGPT 是由美国 AI 研究实验室 OpenAI 创建的,自 2022 年以来就已上市。两者都是专…

使用HBuilderX高效开发微信小程序全流程指南

一、为什么选择HBuilderX开发微信小程序? 1.1 跨平台开发利器 HBuilderX作为DCloud推出的前端开发工具,凭借其强大的uniapp框架支持,已成为多端开发的首选工具。通过一套代码即可编译生成微信小程序、H5、Android/iOS等多端应用&#xff0c…

Python零基础学习第三天:函数与数据结构

一、函数基础 函数是什么? 想象你每天都要重复做同一件事,比如泡咖啡。函数就像你写好的泡咖啡步骤说明书,每次需要时直接按步骤执行,不用重新想流程。 # 定义泡咖啡的函数 def make_coffee(sugar1): # 默认加1勺糖 print("…

自动控制原理【知识点总结、复习笔记】

1.控制系统定义 控制系统是指通过监测和调整系统的行为,以达到预期目标的一套系统。它由一组相互关联的组件组成,这些组件协同工作,用于控制物理过程、机械设备、电子设备或其他系统。例如,一个简单的温控系统可以通过监测房间温…

Git清理本地残留的、但已经在服务器上被删除的分支

要筛选出已经被服务器删除的本地分支,并在本地删除这些分支,可以按照以下步骤进行操作: 步骤 1: 获取远程分支信息,确保本地的远程分支信息是最新的: git fetch -p步骤 2: 列出本地分支和远程分支: git …