DeepSeek-R1-Distill-Qwen-1.5B 本地部署报错解决

server/2025/2/4 12:16:12/
python">from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer
import torch# 加载模型和分词器
model_name = "D:\\Algorithm\\DeepSeek-R1-Distill-Qwen-1.5B\\DeepSeek-R1-Distill-Qwen-1.5B"
tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)# 修改1:显式指定设备并增加稳定性参数
model = AutoModelForCausalLM.from_pretrained(model_name,device_map="auto",torch_dtype=torch.float16,trust_remote_code=True,# 添加稳定性相关参数low_cpu_mem_usage=True,attn_implementation="eager"  # 禁用可能不稳定的优化
).to("cuda")# 修改2:强制转换为评估模式
model.eval()# 流式生成
input_text = "<attn_implementation=eager>,这段代码是干什么用的"
streamer = TextStreamer(tokenizer)
inputs = tokenizer(input_text, return_tensors="pt").to("cuda")
outputs = model.generate(**inputs, max_new_tokens=500)
print(tokenizer.decode(outputs[0]))

本地部署“DeepSeek-R1-Distill-Qwen-1.5B” 运行时候报错 

RuntimeError: probability tensor contains either `inf`, `nan` or element < 0

这里面需要把

model = AutoModelForCausalLM.from_pretrained(model_name,device_map="auto", torch_dtype=torch.float16,trust_remote_code=True,# 添加稳定性相关参数low_cpu_mem_usage=True,attn_implementation="eager"  # 禁用可能不稳定的优化
).to("cuda")

里面torch.float16 变为torch_dtype=torch.bfloat16 即可。 


http://www.ppmy.cn/server/164879.html

相关文章

Mac M1 Comfyui 使用MMAudio遇到的问题解决?

问题1: AssertionError: Torch not compiled with CUDA enabled? 解决办法:修改代码以 CPU 运行 第一步:找到 /ComfyUI/custom_nodes/ComfyUI-MMAudio/mmaudio/ext/autoencoder/vae.py文件中的下面这两行代码 self.data_mean = nn.Buffer(torch.tensor(DATA_MEAN_128D, d…

MATLAB中insertBefore函数用法

目录 语法 说明 示例 在子字符串前插入文本 使用模式在文件名前插入文本 在指定位置前插入子字符串 在字符向量中的指定位置前插入文本 insertBefore函数的功能是在指定的子字符串前插入字符串。 语法 newStr insertBefore(str,pat,newText) newStr insertBefore(st…

4 Spark Streaming

4 Spark Streaming 一级目录1. 整体流程2. 数据抽象3. DStream 相关操作4. Spark Streaming 完成实时需求1) WordCount2) updateStateByKey3) reduceByKeyAndWindow 一级目录 Spark Streaming 是一个基于 Spark Core 之上的实时计算框架&#xff0c;可以从很多数据源消费数据并…

【Go - 小顶堆/大顶堆】

在 Go 语言中&#xff0c;标准库 container/heap 提供了堆&#xff08;Heap&#xff09;的实现。可以使用 container/heap 包来实现自己的大顶堆或小顶堆。 小顶堆示例 以下是一个使用 container/heap 包实现的小顶堆示例&#xff1a; package mainimport ("container/…

HTML 符号详解

HTML 符号详解 引言 HTML(超文本标记语言)符号是HTML文档中用来表示特殊字符的标记。这些符号在日常网页设计和开发中扮演着重要角色,特别是在需要显示版权、商标、货币符号等特殊字符时。本文将详细介绍HTML符号的用法、类型以及如何在HTML文档中插入这些符号。 HTML符号…

新鲜速递:DeepSeek-R1开源大模型本地部署实战—Ollama + MaxKB 搭建RAG检索增强生成应用

在AI技术快速发展的今天&#xff0c;开源大模型的本地化部署正在成为开发者们的热门实践方向。最火的莫过于吊打OpenAI过亿成本的纯国产DeepSeek开源大模型&#xff0c;就在刚刚&#xff0c;凭一己之力让英伟达大跌18%&#xff0c;纳斯达克大跌3.7%&#xff0c;足足是给中国AI产…

DDD - 领域事件_解耦微服务的关键

文章目录 Pre领域事件的核心概念领域事件的作用领域事件的识别领域事件的技术实现领域事件的运行机制案例领域事件驱动的优势 Pre DDD - 微服务设计与领域驱动设计实战(中)_ 解决微服务拆分难题 EDA - Spring Boot构建基于事件驱动的消息系统 领域事件的核心概念 领域事件&a…

数据库 - Sqlserver - SQLEXPRESS、由Windows认证改为SQL Server Express认证进行连接 (sa登录)

本文讲SqlServer Express版本在登录的时候&#xff0c; 如何由Windows认证&#xff0c;修改为Sql Server Express认证。 目录 1&#xff0c;SqlServer Express的Windows认证 2&#xff0c;修改为混合认证 3&#xff0c;启用sa 用户 4&#xff0c;用sa 用户登录 下面是详细…