基于Ubuntu Ollama 部署 DeepSeek-R132B 聊天大模型(附带流式接口调用示例)

devtools/2025/2/11 18:38:26/

最近 DeepSeek出来了,很火,说是能跟ChatGpt o1 媲美,结果,用了DeepSeek的官方服务,提示“服务器繁忙 请稍后再试。”,我就想,算了,自己部署个吧。

我这个是基于docker部署的,首先要docker 支持 显卡,这样才会跑的更快,基于CPU 还是比较卡的,耗费的内存也比较多。

部署非常方便,除了下载很慢,基本都是环境问题,环境解决完就没啥大问题。

服务器基础资源

这就来个服务器部署,目前服务器资源大致如下:

操作系统 : Ubuntu 24.04
显卡:Tesla P100-PCIE-16GB * 2
CPU:48核
内存:64G

运行docker命令

docker run --name ollama -d --restart=always --gpus=all -v /data/docker/ollama:/root/.ollama -p 11434:11434 ollama/ollama

运行完即可

然后,进入到容器内开始执行命令

docker exec -it ollama /bin/sh

然后执行 下载并运行32B 的模型

ollama run deepseek-r1:32b

如果资源不够,可以运行 1.5b 或者 7B的模型

ollama run deepseek-r1:1.5b

下载提示


如果像上面这样能得到MB以上的速度,就说明网络已经非常好了,实际上过一会儿就会降到几百KB,很慢,这个时候,我们只需要 Ctrl + C ,然后,重新输入下载的命令速度就会提升上来,重复此过程,可以加快下载。

运行模型

先给几个命令

ollama pull deepseek-r1:1.5b //拉取模型
ollama run deepseek-r1:1.5b //运行模型
ollama list  //查看所有模型

允许防火墙,这样就可以在自己局域网电脑上访问了

sudo ufw allow  11434/tcp

来先看下都有什么模型

ollama list


有三个模型了

好了,我们先运行模型

ollama run deepseek-r1:32b


直接提示要发送一个消息给它,我们给它一个消息,比如,DeepSeek为何如此优秀?

好吧,回答的好简短,好官方,然后,再问他,如何看待目前的各种AI产品?

这次就回答的特别多了。

现在模型部署好了,我们也可以通过 http地址来看当前 Ollama运行的状态如何.

http://192.168.0.120:11434/

也可以通过 这个api查看部署的模型有什么

http://192.168.0.120:11434/api/tags

可以看到,我用Ollama部署了3个模型。

gpu资源耗费情况


可以看到还好,单卡16GB,还剩5GB 左右,留给其他业务使用。

接口的方式来调用DeepSeekR1,控制台流式输出

实际上Ollama部署好模型后,就可以直接用接口来调用了。

这个就是我自己调用接口实现的本地效果,也是很好用的,省的在docker里面敲来敲去。

主要用.net代码

引入一个nuget包

Codeblaze.SemanticKernel.Connectors.Ollama

具体代码如下:

static async Task Main(string[] args)
{var builder = Kernel.CreateBuilder().AddOllamaChatCompletion("deepseek-r1:32b", "http://192.168.0.120:11434");builder.Services.AddScoped<HttpClient>();var kernel = builder.Build();while (true){string input = "";Console.Write("请输入: ");input = Console.ReadLine();Console.WriteLine("");var contents = kernel.InvokePromptStreamingAsync(input);if (contents == null){Console.WriteLine("Error: 内容为空!");continue;}else{Console.WriteLine($"\nDeepseek: \n");await foreach (var item in contents){Console.Write(item.ToString());}}Console.WriteLine("");}
}

相关地址

https://github.com/kesshei/OllamaDemo
https://gitee.com/kesshei/OllamaDemo

总结

DeepSeek来的刚好,也希望这辈子有幸看到不一样的世界。


http://www.ppmy.cn/devtools/157998.html

相关文章

深入理解QT的View-Model-Delegate机制和用法

文章目录 Model-View-Delegate机制Model(数据模型)设置模型属性访问元素操作元素数据排序封装好的模型View(视图)显示数据数据选择Delegate(代理)数据选择易用封装类QListWidgetQTreeWidgetQTableWidget元素拖拽代理模型参考示例Model-View-Delegate机制 Qt的View/Model/Deleg…

计算机毕业设计Python+Spark知识图谱医生推荐系统 医生门诊预测系统 医生数据分析 医生可视化 医疗数据分析 医生爬虫 大数据毕业设计 机器学习

温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 作者简介&#xff1a;Java领…

GIS笔记之Shapefile与KML相互转换

在GIS应用中&#xff0c;各种不同类型数据的转换与使用是一个重要的环节。在这其中&#xff0c;Shapefile和KML是两种常见的数据形式&#xff0c;两者间的相互转换也是日常工作和学习绕不开的话题。在这里&#xff0c;我们将常用的几种数据转换方法整理如下。 1.Shapefile和KM…

VBA语言的软件工程

VBA语言的软件工程 引言 在当今信息化时代&#xff0c;软件工程已经成为了一门重要的学科&#xff0c;它涉及到软件的设计、开发、测试和维护等多个环节。而在众多编程语言中&#xff0c;Visual Basic for Applications&#xff08;VBA&#xff09;凭借其易学易用的特点&…

Java 读取 Word 模板文档并替换内容生成新文档

嘿&#xff0c;朋友们&#xff01;在实际开发中&#xff0c;经常会遇到需要根据 Word 模板生成特定文档的需求&#xff0c;比如合同、报告等。咱们可以使用 Apache POI 库来读取 Word 模板文档&#xff0c;然后替换其中的指定内容&#xff0c;最后生成新的文档。下面我就详细给…

设计模式学习(四)

行为模式 观察者模式&#xff08;Observer Pattern&#xff09; 定义 它定义了对象之间的一对多依赖关系。当一个对象&#xff08;被观察者&#xff09;的状态发生变化时&#xff0c;所有依赖它的对象&#xff08;观察者&#xff09;都会收到通知并自动更新。 观察者模式的…

网络工程师 (29)CSMA/CD协议

前言 CSMA/CD协议&#xff0c;即载波监听多路访问/碰撞检测&#xff08;Carrier Sense Multiple Access with Collision Detection&#xff09;协议&#xff0c;是一种在计算机网络中&#xff0c;特别是在以太网环境下&#xff0c;用于管理多个设备共享同一物理传输介质的重要…

【AI学习】关于 DeepSeek-R1的几个流程图

遇见关于DeepSeek-R1的几个流程图&#xff0c;清晰易懂形象直观&#xff0c;记录于此。 流程图一 来自文章《Understanding Reasoning LLMs》&#xff0c; 文章链接&#xff1a;https://magazine.sebastianraschka.com/p/understanding-reasoning-llms?continueFlagaf07b1a0…