open-webui+ollama本地部署Llama3

server/2024/10/22 7:18:07/

img

前言

Meta Llama 3 是由 Meta 公司发布的下一代大型语言模型,拥有 80 亿和 700 亿参数两种版本,号称是最强大的开源语言模型。它在多个基准测试中超越了谷歌的 Gemma 7B 和 Mistral 7B Instruct 模型。

安装

1.gpt4all

https://github.com/nomic-ai/gpt4all

img

直接选择系统点击安装,Windows就点Windows,下载完后直接安装即可!

img

内置模型点击Download即可选择你喜欢的大语言模型,8G显存选LLama3 8B即可,70B需要40G的显存才能正常使用。其他模型类似

C:\Users\admin\AppData\Local\nomic.ai\GPT4All           #下载模型保存路径(如果看不到显示隐藏文件)

img

也可以下载大模型(或者你微调的模型)放入该路径,重新启动即可,当做一个webui界面

llama_28">2.open-webui+ollama

llama_30">ollama

https://github.com/ollama/ollama?tab=readme-ov-file

选择对应系统安装

img

安装完后cmd命令行窗口,运行

ollama run llama3             #下载Llama3 8b
ollama run llama3:70b      #下载Llama3 70b  参考下图

img

模型保存在改路径下,

img

安装完Ollama后用open-webui可视化

open-webui

https://github.com/open-webui/open-webui?tab=readme-ov-file

使用docker安装

img

左下角搜索启用或关闭Windows功能,勾选适用于Linux的Windows子系统 ,确定,先不重启

img

安装docker

https://www.docker.com/products/docker-desktop/

下载完直接安装,重启,确定即可

img

打开ollama和docker,cmd命令行:(打开全局代理)

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

下载完后

http://127.0.0.1:3000

点击右上角设置,选择简体中文

img

下载模型 llama3:8b ,点击下载

img

最后可以愉快玩耍了

img

补:lmstudio(问题多)

https://lmstudio.ai/

img

国内安装显示没网,开全局代理也没用,版本更新也快,把huggingface换成国内镜像hf-mirror,没用,又把downloads.json文件更换下载地址,能下但是下载速度贼慢,img

有兴趣可以看看https://www.bilibili.com/video/BV1dw4m1f7zQ/?spm_id_from=333.337.search-card.all.click&vd_source=69a72fa3fe0bf11ff1588ccaeb91737a

最好找个老版本


http://www.ppmy.cn/server/39258.html

相关文章

Debian操作系统简史

一,起源和初衷 Debian项目始于1993年,由Ian Murdock发起,他当时是普渡大学的一名学生。Debian的名字来源于Ian Murdock和他的妻子Debra的组合。Debian的核心理念是创建一个完全自由的操作系统,它遵循严格的自由软件指导原则。 二…

户外公园实景儿童剧本杀小程序系统开发搭建

户外公园实景儿童剧本杀小程序系统开发搭建涉及到的内容包括但不限于以下几个方面: 1. 项目规划:需要考虑场地的大小、设施的配置、剧本的设定等,这些都是开发前的必要考虑因素。 2. 平台开发:基于小程序开发户外公园实景儿童剧本…

学习和“劳动”相关的谚语,柯桥俄语培训

1. Бог труды́ лю́бит. 天道酬勤。 2. В ми́ре нет тру́дных дел, ну́жно лишь усе́рдие. 世上无难事,只怕有心人。 3. У́тро вечера мудренее. 一日之计在于晨。 4. Что посе́ешь,…

Flask应用的部署和使用,以照片分割为例。

任务是本地上传一张照片,在服务器端处理后,下载到本地。 服务器端已经封装好了相关的程序通过以下语句调用 from amg_test import main from test import test main() test() 首先要在虚拟环境中安装flask pip install Flask 文件组织架构 your_pro…

设计模式——解释器模式(Interpreter)

解释器模式(Interpreter Pattern)是一种行为型设计模式,它给定一个语言,定义它的文法的一种表示,并定义一个解释器,该解释器使用该表示来解释语言中的句子。这种模式主要用来描述如何使用面向对象语言构成一…

宝塔面板如何删除一个站点

我们一般的网站都是PHPMySQL开发的,所以删除站点,就要先删数据库,再删网站目录 注意:一点要确保无用的再删 删除站点目录

Map-Reduce是个什么东东?

MapReduce是一种用于使用并行分布式算法在集群计算机上处理大型数据集的编程模型及其相关实现。这一概念首先由Google普及,并随后作为Apache Hadoop项目的一部分开源发布。 MapReduce的基本工作流程: 映射(Mapping):这是第一阶段&#xff0c…

05_SpringCloud

文章目录 SpringCloud服务调用的负载均衡Ribbon负载均衡 面向接口的服务调用OpenFeign 客户端FeignClient日志输出服务调用的超时设置 配置中心Nacos配置中心Nacos配置中心的使用Nacos配置的持久化 SpringCloud 服务调用的负载均衡 问题引出 // 服务发现List<ServiceInstan…