Ubuntu ollama 指定 gpu devices

devtools/2025/3/6 14:40:28/

现状

在二卡机上安装了 dify + ollama + deepseek + stable-diffusion,如果同时运行会提示 OutOfMemoryError: CUDA out of memory. Tried to allocate 74.00 MiB. GPU,在服务器上运行 nvidia-smi -l 明显能看到 gpu 打满了,主要是 stable-diffusion 和 ollama 都会占用 GPU 产生冲突,于是决定将两者使用的GPU分开

ollama 修改环境变量步骤

实际上,直接搜索 ollama 指定 gpu,还是能搜到几个博文的,主要参考如下:
https://www.cnblogs.com/hujunwei/p/18706538
Ollama 自定义在 GPU 中运行
这两篇博文描写得非常详细,我这里直接登录服务器,修改 /etc/systemd/system/ollama.service 文件内容,增加一行 Environment="CUDA_VISIBLE_DEVICES=1",修改后如下:

[Unit]
Description=Ollama Service
After=network-online.target[Service]
ExecStart=/usr/local/bin/ollama serve
User=ollama
Group=ollama
Restart=always
RestartSec=3
Environment="PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin" "OLLAMA_HOST=0.0.0.0:11434"
Environment="CUDA_VISIBLE_DEVICES=1"
Environment="OLLAMA_MODELS=/mnt/data/ollama/models"
[Install]
WantedBy=default.target

保存后执行命令即可生效

sudo systemctl daemon-reload
sudo systemctl restart ollama

详见 https://ollama.com/install.sh
在这里插入图片描述


http://www.ppmy.cn/devtools/165014.html

相关文章

大数据学习(53)-Hive与Impala

&&大数据学习&& 🔥系列专栏: 👑哲学语录: 承认自己的无知,乃是开启智慧的大门 💖如果觉得博主的文章还不错的话,请点赞👍收藏⭐️留言📝支持一下博主哦&#x1f91…

LangChain-08 Query SQL DB 通过GPT自动查询SQL

我们需要下载一个 LangChain 官方提供的本地小数据库。 安装依赖 SQL: https://raw.githubusercontent.com/lerocha/chinook-database/master/ChinookDatabase/DataSources/Chinook_Sqlite.sql Shell: pip install --upgrade --quiet langchain-core langchain-community la…

AD学习-最小系统板,双层

第一章 简单电阻容模型的创建 捕捉栅格在摆放器件时,一般设置成 10mil。移动器件时一般设置成100mil。 比如绘制电容的原理图库,直接就是两根线条竖着成电容, 按Tab键进行颜色变更,按shift键拖动会复制一个出来。 …

生命周期总结(uni-app、vue2、vue3生命周期讲解)

一、vue2生命周期 Vue2 的生命周期钩子函数分为 4 个阶段:创建、挂载、更新、销毁。 1. 创建阶段 beforeCreate:实例初始化之后,数据观测和事件配置之前。 created:实例创建完成,数据观测和事件配置已完成&#xff0c…

23种设计模式之《访问者模式(Visitor)》在c#中的应用及理解

程序设计中的主要设计模式通常分为三大类,共23种: 1. 创建型模式(Creational Patterns) 单例模式(Singleton):确保一个类只有一个实例,并提供全局访问点。 工厂方法模式&#xff0…

GaussianCity:实时生成城市级数字孪生基底的技术突破

在空间智能领域,如何高效、大规模地生成高质量的3D城市模型一直是一个重大挑战。传统方法如NeRF和3D高斯溅射技术(3D-GS)在效率和规模上存在显著瓶颈。GaussianCity通过创新性的技术方案,成功突破了这些限制,为城市级数字孪生的构建提供了全新路径。 一、核心创新:突破传…

[创业之路-329]:华为铁三角实施的步骤

一、通用过程 华为铁三角实施的步骤主要包括以下几个关键阶段: 1、明确角色与职责 确定铁三角成员:组建由客户经理(AR)、解决方案经理(SR)和交付经理(FR)组成的铁三角团队。制定岗…

高精算法的用法及其优势

高精度问题是指当数据的位数非常大(超出标准数据类型的范围)时,如何进行计算和存储的问题。常见场景包括大整数的加、减、乘、除、取模等操作。以下是解决高精度问题的常用方法与技巧: 一、数据存储 数组存储 用整型数组存储&am…