通义千问本地配置并实现微调

ops/2025/3/11 1:31:44/

通义千问本地配置并实现微调

最小Qwen模型大小942mb

from modelscope import snapshot_download
model_dir = snapshot_download(“qwen/Qwen2.5-0.5B”, cache_dir=“./models2.5”)

Qwen2.5-0.5B:942MB

在这里插入图片描述
from modelscope import snapshot_download
model_dir = snapshot_download(“qwen1/Qwen1.5-1.8B”, cache_dir=“./models”)

Qwen1.5-1.8B:2.88GB

在这里插入图片描述

一、环境准备

  1. 硬件要求


http://www.ppmy.cn/ops/164807.html

相关文章

【网络】HTTP协议、HTTPS协议

HTTP与HTTPS HTTP协议概述 HTTP(超文本传输协议):工作在OSI顶层应用层,用于客户端(浏览器)与服务器之间的通信,B/S模式 无状态:每次请求独立,服务器不保存客户端状态(通过Cookie/Session扩展状态管理)。基于TCP:默认端口80(HTTP)、443(HTTPS),保证可靠传输。请…

FPGA基础 -- Verilog常用关键字

Verilog 是一种硬件描述语言(HDL),用于描述和设计数字电路。下面是 Verilog 的常用语法和关键概念: 1. Verilog 设计结构 Verilog 代码通常由 模块(module) 组成,每个模块表示一个硬件单元&…

深度学习激活函数

上图展示常用的几个激活函数,各有优缺点 1. Sigmoid当神经元的激活在接近0或1的时候会饱和,也就是说当x继续变大,函数值不会有什么改变,也就是梯度消失。并且Sigmoid函数的输出不是以0为中心的,所以输出的要么都是正数…

Linux学习笔记(以Ubuntu为例)

以Ubuntu为例操作命令的笔记。 其实Linux不同发行版的基础命令区别不大。 Linux命令基础格式 命令通用格式:command [-options] [parameter] 语法中的[],表示可选的意思 command:命令本身-options:[可选,非必填]…

WordPress开发到底是开发什么?

WordPress 开发主要涉及基于 WordPress 平台构建、定制和扩展网站功能的过程。它不仅仅是简单的网站搭建,而是通过代码和技术实现个性化需求。 以下是 WordPress 开发的核心内容: 1. 主题开发(Theme Development) 功能&#xff…

【redis】全局命令set、get、keys

生产环境 未来在工作中会涉及到的几个环境: 办公环境(入职后,公司给你发个电脑)开发环境 有的时候,开发环境和办公环境是一个(一般做前端和做客户端)有的时候,开发环境是一个单独的…

XGBClassifiler函数介绍

目录 前言函数介绍示例 前言 XGBClassifier 是 XGBoost 库中用于分类任务的类。XGBoost 是一种高效且灵活的梯度提升决策树(GBDT)实现,它在多种机器学习竞赛中表现出色,尤其擅长处理表格数据。 函数介绍 XGBClassifiler(max_de…

美畅物联丨P2P系列之STUN服务器:助力网络穿透

在当今WebRTC等实时通信应用广泛兴起的复杂网络环境下,如何在NAT(网络地址转换)环境中实现高效、稳定的点对点(P2P)连接成为关键。STUN(Session Traversal Utilities for NAT)服务器作为应对这一…