ModelScope推理QwQ32B

embedded/2025/3/17 15:45:19/

文章目录

  • ModelScope推理QwQ32B
    • model_scope下载QwQ32B
    • ModelScope 调用QwQ-32B

QwQ32B_1">ModelScope推理QwQ32B

  • 以下载 qwq32b 为例子

  • 需要安装的 python 包

    transformers==4.49.0
    accelerate>=0.26.0
    torch==2.4.1
    triton==3.0.0
    safetensors==0.4.5
    

    可以使用 conda 创建一个虚拟环境安装

    conda create --name llm python==3.10
    

    切到虚拟环境

    conda activate llm
    

    指定源安装,保存为 requirement.txt 安装(这里用的中科大的源)

    pip install -r requirements.txt --index https://pypi.mirrors.ustc.edu.cn/simple
    
  • QwQ32B硬件要求

    这里使用满精度的QwQ32B,需要64G显存

    硬件配置模型推理模型高效微调模型全量微调
    显存占用最低配置显存占用最低配置显存占用最低配置
    FP_1664GRTX3090*4(94G)92GRTX3090*4(94G)350GA100*6(480G)
    Q_4_K_M23GRTX3090(24G)31GRTX3090*2(48G)
  • 当前文件夹,请自行替换自己的文件夹

    /root/lanyun-tmp/

QwQ32B_47">model_scope下载QwQ32B

  • 创建文件夹统一存放Modelscope下载的模型

    mkdir Model-Scope
    
  • 安装 modelscope

    pip install modelscope --index https://pypi.mirrors.ustc.edu.cn/simple
    
    1. modelscope download:ModelScope 命令行工具的下载命令,用于从 ModelScope 平台下载指定的模型。

    2. --model Qwen/Qwen2.5-0.5B-Instruct

      --model 参数指定要下载的模型的唯一标识符(Model ID)。

      Qwen/Qwen2.5-0.5B-Instruct 模型的 ID,

    3. --local_dir /root/lanyun-tmp/Model-Scope/Qwen2.5-0.5B

      --local_dir 参数指定模型下载后存放的本地目录路径。

      /root/lanyun-tmp/Model-Scope/Qwen2.5-0.5B 是目标目录路径,表示模型将被下载到这个目录中。

  • 执行下载模型的命令

    https://modelscope.cn/models/Qwen/QwQ-32B/files

    复制全名

    Qwen/QwQ-32B

    modelscope download --model Qwen/QwQ-32B --local_dir /root/lanyun-tmp/Model-Scope/QwQ-32B
    

    等待下载完成

    image-20250314211957063

  • 下载完成查目录

    ls Model-Scope/QwQ-32B
    

    可以看到模型文件都下载下来了

    image-20250314212235508

QwQ32B_101">ModelScope 调用QwQ-32B

  • 代码

    from modelscope import AutoModelForCausalLM, AutoTokenizer
    model_name = "./Model-Scope/QwQ-32B/"model = AutoModelForCausalLM.from_pretrained(model_name,torch_dtype="auto",device_map="auto",low_cpu_mem_usage=True
    )tokenizer = AutoTokenizer.from_pretrained(model_name)prompt = "你好"
    messages = [{"role": "user", "content": prompt}
    ]text = tokenizer.apply_chat_template(messages,tokenize=False,add_generation_prompt=True
    )model_inputs = tokenizer([text], return_tensors="pt").to(model.device)generated_ids = model.generate(**model_inputs,max_new_tokens=32768
    )generated_ids = [output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
    ]response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]print(response)
    
  • 为快速演示就直接在命令行上了

    image-20250316231114327

    查看下满精度的显存使用量,可以看到用了63.7G左右

    image-20250316231659348



http://www.ppmy.cn/embedded/173375.html

相关文章

c#:使用串口通讯实现数据的发送和接收

串口通讯(Serial Communication)是一种常见的硬件设备与计算机之间的数据传输方式,广泛应用于工业控制、嵌入式系统、传感器数据采集等领域。本文将详细介绍如何使用C#实现基于串口通讯的数据发送和接收,并结合代码示例解析其实现…

在使用element-ui时表单的表头在切换页面时第一次进入页面容易是白色字体解决方法

在里面添加:header-cell-style"{ color: black }" <el-table :data"tableData" style"width: 100%" height"250" :header-cell-style"{ color: black }" ></el-table> 正确代码是 <templat…

贪吃蛇小游戏-简单开发版

一、需求 本项目旨在开发一个经典的贪吃蛇游戏&#xff0c;用户可以通过键盘控制蛇的移动方向&#xff0c;让蛇吃掉随机出现在游戏区域内的食物&#xff0c;每吃掉一个食物&#xff0c;蛇的身体长度就会增加&#xff0c;同时得分也会相应提高。游戏结束的条件为蛇撞到游戏区域的…

【3D视觉学习笔记2】摄像机的标定、畸变的建模、2D/3D变换

本系列笔记是北邮鲁老师三维重建课程笔记&#xff0c;视频可在B站找到。 1. 摄像机的标定 摄像机标定的过程就是从1张或者多张图片中求解相机的内外参数的过程。 根据上一节的知识&#xff0c;针孔摄像机模型的世界坐标系到成像平面的映射关系为 p K [ R , T ] P p K[R,T]…

SQL与NoSQL的区别

以下是SQL与NoSQL数据库的详细对比&#xff0c;涵盖核心特性、适用场景及技术选型建议&#xff1a; 一、核心区别对比 特性SQL&#xff08;关系型数据库&#xff09;NoSQL&#xff08;非关系型数据库&#xff09;数据模型基于表格&#xff0c;严格预定义模式&#xff08;Schem…

JavaScript性能优化实战指南

JavaScript性能优化实战指南 1. 性能分析工具与指标 核心工具链 Chrome DevTools&#xff1a; Performance面板&#xff1a;记录运行时性能&#xff0c;分析长任务&#xff08;Long Tasks&#xff09;、强制回流&#xff08;Layout Shifts&#xff09;、函数调用堆栈。Memory面…

计算机网络——NAT

一、什么是NAT&#xff1f; NAT&#xff08;Network Address Translation&#xff0c;网络地址转换&#xff09; 是一种将 私有IP地址 与 公有IP地址 相互映射的技术&#xff0c;主要用于解决IPv4地址不足的问题。它像一名“翻译官”&#xff0c;在数据包经过路由器或防火墙时…

传统RAG vs 知识图谱:大模型时代的知识管理革命

引言&#xff1a;为什么需要突破传统RAG&#xff1f; 在大模型应用落地的浪潮中&#xff0c;检索增强生成&#xff08;RAG&#xff09;技术通过连接外部知识库&#xff0c;有效缓解了模型的幻觉问题。然而&#xff0c;当面对复杂关系推理、多文档关联分析等场景时&#xff0c;…