本地部署【LLM-deepseek】大模型 ollama+deepseek/conda(python)+openwebui/docker+openwebui

devtools/2025/2/19 8:07:20/

通过ollama本地部署deepseek
总共两步
1.模型部署
2.[web页面]

参考官网
ollama:模型部署
https://ollama.com/
open-webui:web页面
https://github.com/open-webui/open-webui

设备参考 Mac M 芯片 windows未知

蒸馏模型版本:deepseek-r1:14b 运行情况macminim2 24+256 本地部署后内存舒缓,不影响电脑其他软件使用macminim4 16+256 本地部署后内存紧张,影响电脑其他软件使用内存占用情况:11G -> 21.72G 模型思考时,大概会占用11到12G的内存 

1.ollama:模型部署

	# 下载 ollamahttps://ollama.com/# 运行 deepseek 选择自己设备适合的版本[:14b],官网看命令 ollama run deepseek-r1:14b # 当前终端运行,可在终端交互ollama run deepseek-r1:14b & disown   # 放到后台去跑,终端页面关掉也不会关闭此模型

python_32">2.open-webui:web页面 推荐python的终端部署方式

dockerweb_34">2.1 docker部署web页面

	#docker pull ghcr.io/open-webui/open-webui:main# 创建本地目录,避免重启后数据丢失mkdir /Users/admin/program/docker/instance/open-webui/datacd /Users/admin/program/docker/instance/open-webui# 启动容器docker run -d -p 3000:8080 -v $PWD/data:/app/backend/data --name open-webui ghcr.io/open-webui/open-webui:main

pythonweb_python__45">2.2 python部署web页面 需要在有python环境下执行 推荐

	pip install open-webuiopen-webui serveopen-webui serve & disown # This will start the Open WebUI server, which you can access at http://localhost:8080

condapython_53">2.3 [忽略] conda创建python环境

	conda create -n openwebui python=3.12 -y # python=3.12:指定 Python 版本 -y:自动确认安装conda initconda activate openwebuipip install open-webuiopen-webui serve							# 这个不能关闭终端open-webui serve & disown  					# 使用这个启动成功后,可以关闭终端了open-webui serve > /dev/null 2>&1 & disown 	# 使用这个启动成功后,可以关闭终端了# This will start the Open WebUI server, which you can access at http://localhost:8080# 放在后台的任务如何查看呢jobs							# 使用 jobs 命令查看当前作业状态。ps aux | grep "your-command"	# 或者使用 ps aux | grep "your-command" 检查进程是否存在。

http://www.ppmy.cn/devtools/158693.html

相关文章

在亚马逊云科技上一键自动部署Falcon3大语言模型

由TII(阿布扎比技术创新研究所)开发的全新的Falcon 3系列模型,已经在亚马逊云科技的模型自动化快速部署功能 - Amazon SageMaker JumpStart上可以使用了。在本文中小李哥就将带大家探训如何在Amazon SageMaker AI上高效部署Falcon3模型。 Fa…

讲解一下SpringBoot的RPC连接

Spring Boot 本身并不直接提供 RPC(Remote Procedure Call,远程过程调用)功能,但可以通过集成其他框架或库来实现 RPC 通信。常见的 RPC 框架包括 Dubbo、gRPC、Thrift、Spring Cloud 等。下面我将讲解如何在 Spring Boot 中集成和…

ChartDB:一个基于Web的可视化数据库设计工具

这次给大家介绍一个可视化的数据库设计工具:ChartDB。 ChartDB 是一个免费开源的数据库可视化设计工具,支持的数据库包括 MySQL、MariaDB、PostgreSQL、Microsoft SQL Server、SQLite、ClickHouse 等。 对于已有的数据库,ChartDB 提供了一键…

【生产变更】- 19c ADG failover

【生产变更】- 19c ADG failover 一、概述二、操作步骤2.1 备库停止mrp2.2 备库进行failover2.3 新主库置为open状态2.4 确认新主库数据库角色 一、概述 Failover场景通常在主库突发故障(如硬件故障、数据库故障、操作系统故障等),短时间无法…

爬虫JS逆向 - 从入门到实战

第一章:JS逆向的基础知识 1.1 什么是JS逆向 JS逆向(JavaScript Reverse Engineering)是指通过分析前端JavaScript代码,提取其中的数据逻辑、API请求、加密方式等信息的过程。其目的是绕过前端的动态加载机制,直接获取我们需要的数据。 1.2 动态网页的工作原理 传统的静…

嵌入式linux下如何通过IIS接口驱动实现录制pcm音频

在嵌入式 Linux 下,通常使用 ALSA(Advanced Linux Sound Architecture)而不是 IIS(Internet Information Services,它主要用于 Windows 上的 Web 服务,这里你可能想说的是 I2S,Inter - Integrat…

Day1:强化学习基本概念

一、基本概念 1. Agent 智能体:执行动作的对象 2. State 状态:对当前环境的概括 3. Action 动作:智能体基于当前状态做出的决策 4. Reward 奖励:智能体执行完一个动作后,环境反馈给智能体的一个数值。(…

CentOS 7操作系统部署KVM软件和创建虚拟机

CentOS 7.9操作系统部署KVM软件和配置指南,包括如何创建一个虚拟机。 步骤 1: 检查硬件支持 首先,确认您的CPU支持虚拟化技术,并且已在BIOS中启用: egrep -c (vmx|svm) /proc/cpuinfo 如果输出大于0,则表示支持虚拟…