win11本地部署deepseek大模型(安装ollama+docker+open-webui)最终实现自己的项目可通过API调用投喂数据后的模型

embedded/2025/3/4 14:53:12/
aidu_pl">

硬件配置:笔记本win11,内存32G,CPU锐龙7 ,无独显;只能考虑deepseek-r1:1.5b模型。

第一步:安装Ollama

此处不过多累赘了,https://ollama.com/官网选择对应的系统版本下载即可。

需要注意的是直接安装是安装到C盘,也可以通过命令安装到D盘。

通过 ”OllamaSetup.exe /dir="D:\Program Files\Ollama”命令可以指定Ollama安装目录

C:\Users\weijian>d:
D:\>cd “Program Files"
D:\Program Files>OllamaSetup.exe /dir="D:\Program Files\Ollama”

安装成功后,再下载deepseek-r1的模型(并保存在 C 盘,C:\Users<username>.ollama\models 如果想更改默认路径,可以通过设置ollama_models进行修改,然后重启终端,重启 ollama 服务)。

ollama run deepseek-r1:1.5b

此处因为我下载完成了,第一次执行时候等待完成100%即可。

第二步:安装docker

安装之前准备工作

1 CPU开启虚拟化

没有开启的需要通过BIOS进行开启,这去取决于每个人的电脑,不同的品牌操作起来不一样

2启用关闭Windows功能

官网直接下载安装https://www.docker.com/

第三步:部署open-webui

开源open webUI 官网🏡 Home | Open WebUI

docker方式安装

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

完成后访问http://localhost:3000/

第一次登录需要注册管理员,进入后台发现页面非常友好且功能强大。

在工作空间内可以添加知识库,添加模型(基础模型+知识库)。

第四步:关于API调用问题

ollama的API调用   GitHub - ollama/ollama: Get up and running with Llama 3.3, DeepSeek-R1, Phi-4, Gemma 2, and other large language models.

postman测试

 

open-webui的API调用

https://docs.openwebui.com/getting-started/api-endpoints/

postman测试

最后总结,部署还有其他方式 Linux系统  sglang/vllm。


http://www.ppmy.cn/embedded/169487.html

相关文章

计算机网络——详解TCP三握四挥

文章目录 前言一、三次握手1.1 三次握手流程1.2 tcp为什么需要三次握手建立连接&#xff1f; 二、四次挥手2.1 四次挥手流程2.2 为什么是四次&#xff0c;不是三次&#xff1f;2.3 为什么要等待2msl&#xff1f;2.4 TCP的保活计时器 前言 TCP和UDP是计算机网络结构中运输层的两…

半导体制造工艺(二)光刻工艺—掩模版

在上文中我们已经简单概述了光刻工艺的大致流程。接下来将会介绍在光刻工艺中所需用到的必备材料以及设备。例如掩模版、光刻胶、匀胶机、光刻机等等。由于需要保持讲述工艺的完整性以及流畅&#xff0c;每一个都需要涉及&#xff0c;所以每次仅是侧重点不同。此篇主要讲述的是…

【开源免费】基于SpringBoot+Vue.JS医院药品管理系统(JAVA毕业设计)

本文项目编号 T 221 &#xff0c;文末自助获取源码 \color{red}{T221&#xff0c;文末自助获取源码} T221&#xff0c;文末自助获取源码 目录 一、系统介绍二、数据库设计三、配套教程3.1 启动教程3.2 讲解视频3.3 二次开发教程 四、功能截图五、文案资料5.1 选题背景5.2 国内…

基于Matlab的多目标粒子群优化

在复杂系统的设计、决策与优化问题中&#xff0c;常常需要同时兼顾多个相互冲突的目标&#xff0c;多目标粒子群优化&#xff08;MOPSO&#xff09;算法应运而生&#xff0c;作为群体智能优化算法家族中的重要成员&#xff0c;它为解决此类棘手难题提供了高效且富有创新性的解决…

mysql的主从同步

1、异步复制&#xff1a;这是MySQL默认的复制模式。在这种模式下&#xff0c;主库在执行完客户端提交的事务后会立即将结果返回给客户端&#xff0c;并不关心从库是否已经接收并处理。这种模式的优点是实现简单&#xff0c;但缺点是如果主库崩溃&#xff0c;已经提交的事务可能…

PHP找回密码工具:快速破解自己的密码

用于已知MD5密文值(比如宝塔旧版sqlite数据库里的密码)&#xff0c;提交自己可能的几十个密码用于一次性判断是什么密码&#xff0c;规避验证码影响枚举效率/密码尝试次数限制/忘记刚才填写什么正确密码而重复提交密码/登陆成功了却忘记刚才成功的密码等情况。 <?php if ($…

vllm源码解析(一):整体架构与推理代码

vlllm官方代码更新频发,每个版本都有极大变动, 很难说哪个版本好用. 第一次阅读vllm源码是0.4.0版本,对这版圈复杂度极高的调度代码印象深刻 0.4.1对调度逻辑进行重构,完全大变样, 读代码速度快赶不上迭代的速度了。 现在已经更新到0.5.4, 经过长时间观察&#xff0c;发现主要的…

Spring Boot的项目结构

Spring Boot的项目结构 技术背景 Spring Boot项目结构遵循Maven或Gradle的标准目录结构&#xff0c;同时融入了Spring Boot的特定约定。良好的项目结构不仅有助于代码组织&#xff0c;还能提高开发效率和项目可维护性。了解Spring Boot的项目结构对于开发高质量的应用至关重要…