Ubuntu ollama 指定 gpu devices

Ubuntu ollama 指定 gpu devices

devtools/2025/3/6 14:40:28/

现状

在二卡机上安装了 dify + ollama + deepseek + stable-diffusion，如果同时运行会提示 OutOfMemoryError: CUDA out of memory. Tried to allocate 74.00 MiB. GPU，在服务器上运行 nvidia-smi -l 明显能看到 gpu 打满了，主要是 stable-diffusion 和 ollama 都会占用 GPU 产生冲突，于是决定将两者使用的GPU分开

ollama 修改环境变量步骤

实际上，直接搜索 ollama 指定 gpu，还是能搜到几个博文的，主要参考如下：
https://www.cnblogs.com/hujunwei/p/18706538
Ollama 自定义在 GPU 中运行
这两篇博文描写得非常详细，我这里直接登录服务器，修改 /etc/systemd/system/ollama.service 文件内容，增加一行 Environment="CUDA_VISIBLE_DEVICES=1"，修改后如下：

[Unit]
Description=Ollama Service
After=network-online.target[Service]
ExecStart=/usr/local/bin/ollama serve
User=ollama
Group=ollama
Restart=always
RestartSec=3
Environment="PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin" "OLLAMA_HOST=0.0.0.0:11434"
Environment="CUDA_VISIBLE_DEVICES=1"
Environment="OLLAMA_MODELS=/mnt/data/ollama/models"
[Install]
WantedBy=default.target

保存后执行命令即可生效

sudo systemctl daemon-reload
sudo systemctl restart ollama

详见 https://ollama.com/install.sh
在这里插入图片描述

http://www.ppmy.cn/devtools/165014.html

相关文章

大数据学习（53）-Hive与Impala

大数据学习（53）-Hive与Impala

&&大数据学习&& 🔥系列专栏： 👑哲学语录: 承认自己的无知，乃是开启智慧的大门 💖如果觉得博主的文章还不错的话，请点赞👍收藏⭐️留言📝支持一下博主哦&#x1f91…

阅读更多...

LangChain-08 Query SQL DB 通过GPT自动查询SQL

LangChain-08 Query SQL DB 通过GPT自动查询SQL

我们需要下载一个 LangChain 官方提供的本地小数据库。安装依赖 SQL: https://raw.githubusercontent.com/lerocha/chinook-database/master/ChinookDatabase/DataSources/Chinook_Sqlite.sql Shell: pip install --upgrade --quiet langchain-core langchain-community la…

阅读更多...

AD学习-最小系统板，双层

AD学习-最小系统板，双层

第一章简单电阻容模型的创建捕捉栅格在摆放器件时，一般设置成 10mil。移动器件时一般设置成100mil。比如绘制电容的原理图库，直接就是两根线条竖着成电容， 按Tab键进行颜色变更，按shift键拖动会复制一个出来。 …

阅读更多...

生命周期总结（uni-app、vue2、vue3生命周期讲解）

生命周期总结（uni-app、vue2、vue3生命周期讲解）

一、vue2生命周期 Vue2 的生命周期钩子函数分为 4 个阶段：创建、挂载、更新、销毁。 1. 创建阶段 beforeCreate：实例初始化之后，数据观测和事件配置之前。 created：实例创建完成，数据观测和事件配置已完成&#xff0c…

阅读更多...

23种设计模式之《访问者模式（Visitor）》在c#中的应用及理解

23种设计模式之《访问者模式（Visitor）》在c#中的应用及理解

程序设计中的主要设计模式通常分为三大类，共23种： 1. 创建型模式（Creational Patterns） 单例模式（Singleton）：确保一个类只有一个实例，并提供全局访问点。工厂方法模式&#xff0…

阅读更多...

GaussianCity：实时生成城市级数字孪生基底的技术突破

GaussianCity：实时生成城市级数字孪生基底的技术突破

在空间智能领域，如何高效、大规模地生成高质量的3D城市模型一直是一个重大挑战。传统方法如NeRF和3D高斯溅射技术（3D-GS）在效率和规模上存在显著瓶颈。GaussianCity通过创新性的技术方案，成功突破了这些限制，为城市级数字孪生的构建提供了全新路径。一、核心创新：突破传…

阅读更多...

[创业之路-329]：华为铁三角实施的步骤

[创业之路-329]：华为铁三角实施的步骤

一、通用过程华为铁三角实施的步骤主要包括以下几个关键阶段： 1、明确角色与职责确定铁三角成员：组建由客户经理（AR）、解决方案经理（SR）和交付经理（FR）组成的铁三角团队。制定岗…

阅读更多...

高精算法的用法及其优势

高精算法的用法及其优势

高精度问题是指当数据的位数非常大（超出标准数据类型的范围）时，如何进行计算和存储的问题。常见场景包括大整数的加、减、乘、除、取模等操作。以下是解决高精度问题的常用方法与技巧： 一、数据存储数组存储用整型数组存储&am…

阅读更多...

最新文章