本地算力部署大模型详细流程(一)

news/2025/3/15 10:38:00/
aidu_pl">

1、版本选择

本地部署就是自己部署deepseek模型,使用本地的算力。

  • 主要瓶颈:内存+显存的大小。
  • 特点:此方案不用联网。
  • 适合:有数据隐私方面担忧的或者保密单位根本就不能上网的。

在这里插入图片描述

2、部署过程

比较流行的是使用ollama:https://ollama.com/
Ollama(在本地作为服务端,可以是别的平台)+ Open WebUI等(https://github.com/open-webui/open-webui,前端,可以是别的工具如Chrome插件Page Assist或Anything LLM)

步骤1:下载Ollama

在这里插入图片描述

步骤2:安装Ollama

自定义Ollama安装路径

手动创建Ollama安装目录

首先在你想安装的路劲下创建好一个文件夹,并把Ollama的安装包放在里面。比如我的是:D:\softw\Ollama

在这里插入图片描述

在文件路径上输入CMD回车

在这里插入图片描述

输入命令符安装

然后再CMD窗口输入:OllamaSetup.exe /DIR=D:\softw\Ollama
语法:软件名称 /DIR=这里放你上面创建好的Ollama指定目录

在这里插入图片描述

在这里插入图片描述

手动创建大模型存储目录

添加环境变量

右键“我的电脑”,选择“属性”,按如下方式配置:

在这里插入图片描述

在这里插入图片描述

注意:修改完之后,需要重启Ollama客户端,右键图标,选择退出,重新运行Ollama

在这里插入图片描述

验证安装

”win+r“输入cmd

命令行输入如下:

ollama -v

在这里插入图片描述

能显示ollama版本说明安装成功。

步骤3:选择r1模型

在这里插入图片描述

在这里插入图片描述

  • b代表10亿参数量,8b就是80亿参数量。这里的671B是HuggingFace经过4-bit 标准量化的,所以大小是404GB。
  • ollama 支持 CPU 与 GPU 混合推理。将内存与显存之和大致视为系统的 “总内存空间”。

步骤4:本地运行DeepSeek模型

在命令行中,输入如下命令:

ollama run deepseek-r1:8b

在这里插入图片描述

下载支持断点续传,如果下载中速度变慢,可以鼠标点击命令行窗口,然后ctrl+c取消,取消后按方向键“上”,可以找到上一条命令,即”ollama run deepseek-r1:8b“,按下回车会重新链接,按照之前进度接着下载。

下载完成后,自动进入模型,直接在命令行输入问题,即可得到回复。

  • 比如:打个招呼!

在这里插入图片描述

  • 获取帮助:
/?
  • 退出对话:
/bye

步骤5:查看已有模型

ollama list

后续要运行模型,仍然使用之前的命令:

ollama run deepseek-r1:8b

http://www.ppmy.cn/news/1579288.html

相关文章

python 获取鼠标在屏幕上的具体位置以及动作,判断鼠标是否在浏览器内

python 获取鼠标在屏幕上的具体位置以及动作,判断鼠标是否在浏览器内 在Python中,要获取鼠标在屏幕上的具体位置以及动作,并判断鼠标是否在浏览器内,我们可以使用pyautogui库。pyautogui是一个非常强大的库,可以用来模拟鼠标操作、…

Web安全:保护您的网站免受网络威胁

在当今数字化时代,Web安全已成为每个网站和应用程序开发者的首要任务。无论是小型博客还是大型电商平台,网络攻击都可能带来灾难性后果。本文将探讨Web安全的重要性,并分享一些关键的最佳实践,帮助您保护网站免受威胁。 为什么Web…

具备多种功能的PDF文件处理工具

软件介绍 在日常办公和学习场景中,PDF文件使用极为频繁,而一款功能强大的PDF编辑软件能大幅提升处理效率。 今天要介绍的Adobe Acrobat Pro DC 2024.005.20414,就具备像编辑Word文档一样便捷编辑PDF的能力。 PDF文档在学习和工作中广泛应用…

【eNSP基础使用教程-1】

座右铭: 纵有疾风起,人生不言弃。 文章目录 前言一、更改设备名称指令1、双击路由器进入2、 进入系统视图3、更改设备名称为R14、使用同样的办法修改路由器R2、R3 二、配置路由物理接口的IP 地址1、查看R1路由器当前接口IP 地址配置与路由表2、查看路由器上的路由表…

北京迅为iTOP-RK3568开发板OpenHarmony系统南向驱动开发实操-HDF驱动配置LED

瑞芯微RK3568芯片是一款定位中高端的通用型SOC,采用22nm制程工艺,搭载一颗四核Cortex-A55处理器和Mali G52 2EE 图形处理器。RK3568 支持4K 解码和 1080P 编码,支持SATA/PCIE/USB3.0 外围接口。RK3568内置独立NPU,可用于轻量级人工…

conda install 和 pip install 的区别

conda install 和 pip install 是两个常用的包安装命令,但它们在很多方面存在差异。 1. 所属管理系统不同 1.1 conda install conda install 是Anaconda和Miniconda发行版自带的包管理工具 conda 的安装命令。conda 是一个跨平台的开源包管理系统和环境管理系统&…

Apache Shiro反序列化漏洞深度剖析:从原理到利用

引言 在Web安全的世界里,反序列化漏洞一直是最危险的漏洞类型之一。今天,我们将深入探讨Apache Shiro框架中的两个著名反序列化漏洞.通过通俗易懂的解释和详细的实例,帮助你理解这类漏洞的本质和危害。 Shiro框架与"记住我"功能简…

Redis实现高并发排行榜的功能

生活中排行榜是常见的功能,如游戏的排行榜,销售额的排行榜等等,排行榜不仅可以让用户有更多的激情参与到活动中来,而且可以更好的留存住用户,如下所示的拉新排行榜: 排行榜是一个常见的业务需求&#xff0…