[大模型]本地离线运行openwebui+ollama容器化部署

embedded/2025/1/11 5:24:07/

本地离线运行Openweb-ui ollama容器化部署

  • 说明
  • 安装
    • internet操作
    • 内网操作
  • 问题
    • 线程启动错误
    • 最终命令
  • 总结

说明

最近公司有一个在内网部署一个离线大模型的需求,网络是离线状态,服务器有A100GPU,一开始是想折腾开源chatGML4大模型,因为使用过gml3,所以想着部署gml4应该不难。于是把模型和程序下载好,把模型导入到内网…发现不能使用网页版运行,只能使用客户端运行,用自带网页需要依赖gradio组件,该组件又需要联网…好吧,如果您知道怎么离线运行,请视我无知…于是查询,更换了一种更便捷的方案部署。Open-webui+ollama的方案,Open-webui是网页界面服务,ollama是大模型运行框架,支持多种大模型,只需要选择切换就能切换不同模型运行了。开整!

安装

internet操作

这里使用docker镜像容器的方式安装,简化部署和运行。
1.拉取镜像,这里虽然可以分别拉取Open-webui和ollama镜像,但是我仍然推荐你拉取一个镜像就好了。

docker pull ghcr.io/open-webui/open-webui:ollama

拉取完这个镜像,run起来就算部署完了。这个镜像是包含两个组件,并且是openwebui官网提供说明的下载地址。可能会有点慢,但是实测是可以拉取下来的。
2.run起镜像来。

docker run -d -p 3000:8080 --gpus=all -v /raid/Test/ollama:/root/.ollama -v open-webui:/app/backend/data --name open-webui --restart

http://www.ppmy.cn/embedded/152917.html

相关文章

Git 的引用规格(refspec)语法

目录 引用规格语法格式常见用法强制 -f 和 的区别git fetch origin remote-branch:local-branch 和 git push origin local-branch:remote-branch 区别 引用规格语法格式 格式如下&#xff1a;[]<src>:<dst> 常见用法 # fetch git fetch origin <remote-bra…

功能篇:mybatis中批量插入

在 MyBatis 中进行批量插入&#xff0c;可以通过几种不同的方式来实现。以下是两种常见的方法&#xff1a; ### 1. 使用 foreach 标签 MyBatis 提供了 <foreach> 元素来遍历集合&#xff08;如 List、Set 等&#xff09;&#xff0c;这可以用来构建动态 SQL 语句&#xf…

git命令收集

强制丢弃所有修改&#xff0c;和仓库代码一致 git reset --hard 更新子模块 git submodule update每个子模块 重置到最新节点 git submodule foreach --recursive git reset --hard清除每个子模块未跟踪的文件 git submodule foreach --recursive git clean -fd清理未跟踪的…

Spring实现通过工具类统一输出日志(不改变日志类信息)

版权说明&#xff1a; 本文由CSDN博主keep丶原创&#xff0c;转载请保留此块内容在文首。 原文地址&#xff1a; https://blog.csdn.net/qq_38688267/article/details/145022997 背景 实现输出带动态标签的日志需求后&#xff0c;实际操作过程中&#xff0c;输出日志的代码为&a…

maven的生命周期

1.maven的生命周期是什么&#xff1f; Maven的生命周期就是为了对所有的maven项目构建过程进行抽象和统一。 2.Maven中有3套相互独立的生命周期&#xff1a; clean&#xff1a;清理工作。 default&#xff1a;核心工作&#xff0c;如&#xff1a;编译、测试、打包、安装、部署等…

pytorch torch.full_like函数介绍

torch.full_like 是 PyTorch 中用于创建一个具有特定值的新张量&#xff0c;其形状和数据类型与给定张量相同。 函数定义 torch.full_like(input, fill_value, *, dtypeNone, layoutNone, deviceNone, requires_gradFalse, memory_formattorch.preserve_format)参数说明 inpu…

本地ollama连接不稳定,embeding易断开:faiss小样本向量数据库合成

解析了800份PDF&#xff0c;在使用ollama转向量数据库时&#xff0c;总是会中间断开。解决思路是划分了7个batch&#xff0c;每个batch有100份&#xff0c;在将batch转向量数据库&#xff0c;这时就很少断开了。 正好faiss提供了一个方法&#xff0c;merge_from&#xff0c;能够…

【源码+文档+调试讲解】项目申报小程序

摘 要 随着信息技术和网络技术的飞速发展&#xff0c;人类已进入全新信息化时代&#xff0c;传统管理技术已无法高效&#xff0c;便捷地管理信息。为了迎合时代需求&#xff0c;优化管理效率&#xff0c;各种各样的管理系统应运而生&#xff0c;各行各业相继进入信息管理时代…