基于ollama搭建本地chatGPT

embedded/2024/9/24 17:15:44/

ollama帮助我们可以快速在本地运行一个大模型,再整合一个可视化页面就能构建一个chatGPT,可视化页面我选择了chat-ollama(因为它还能支持知识库,可玩性更高),如果只是为了聊天更推荐chatbox

部署步骤

  1. 下载ollama并启动,参考:https://ollama.com/download
# 启动命令
ollama serve
  1. 下载chat-ollama,参考:https://github.com/sugarforever/chat-ollama。本人使用docker安装的
docker compose up
# 如果您是第一次启动,需要初始化 SQLite 数据库,在新的控制台运行
docker-compose exec chatollama npx prisma migrate dev
  1. 访问chat-ollama,网址:http://localhost:3000
  2. 配置ollama地址
    在这里插入图片描述
  3. 点击models,下载模型llama2-chinese。因为Llama 2 本身的中文比较弱。在这里插入图片描述
  4. 开始聊天
    在这里插入图片描述

注意

llama2-chinese模型最少要8G内存

  • 7b models generally require at least 8GB of RAM
  • 13b models generally require at least 16GB of RAM

CPU跑的太慢,用GPU的话也要差不多8G显存
在这里插入图片描述


http://www.ppmy.cn/embedded/3511.html

相关文章

密码学基础 -- 走进RSA(1)(放弃数学原理版)

目录 1. 密钥对的使用时机 2.小结 在讲RSA原理时,咱们先来思考非对称算法的几个问题。 使用RSA对数据进行加密时,应该使用公钥还是私钥?那解密的时候呢?使用RSA对Hash进行签名时,应该使用公钥还是私钥?那…

Python的pytest框架(4)--参数化测试

在 pytest 测试框架中,参数化测试(Parametrized Testing)意味着将一个测试用例设计为能够接受不同输入数据(参数)并分别执行,以验证被测试代码在面对多种情况时的行为是否符合预期。参数化测试的核心理念是…

毕设选51还是stm32?51太简单?

如果你更倾向于挑战和深入学习,STM32可能是更好的选择。如果你希望更专注于底层硬件原理,51可能更适合。我这里有一套嵌入式入门教程,不仅包含了详细的视频讲解,项目实战。如果你渴望学习嵌入式,不妨点个关注&#xff…

Docker向harbor上传大镜像的413报错

文章目录 一、背景二、问题三、处理1.调整harbor相关大小2.正向代理的nginx参数 一、背景 最近遇到了个需求,某厂商的系统模块以容器模式部署在我们的内网环境中,厂商为我们提供了一个公网仓库,需要我们自己下载相关镜像。因此,获…

28、Lua 如何输出树状结构的table?

为了让游戏前端数据输出更加条理,做了一个简单树状结构来打印数据。 ccmlog.lua local function __tostring(value, indent, vmap)local str indent indent or vmap vmap or {}--递归结束条件if (type(value) ~ table) thenif (type(value) string) then--字符…

Vue 3 中 Props 传值的完整指南

一、定义 Props 类型 首先,我们需要定义一个接口来描述我们的props类型。这通常在一个专门的类型声明文件中完成,例如types/index.ts: // types/index.ts export interface Parent {id: number;title: string; } export type ParentArray …

ASP.NET基于BS结构的实验室预约模型系统

摘 要 《基于B/S结构的实验室预约模型系统》是采用ASP.NET开发的一个开放实验室预约系统。本系统是针对目前实验室手工管理效率低下,缺乏安全性、可控性等缺点,以校园网为依托,采用科学、高效的教学管理方式,使学校的教学资源得…

设计模式(022)行为型之解释器模式

解释器模式是一种行为型设计模式,用于定义一种语言的文法,并且在该语言中解释句子的意义。这种模式通常用于实现编程语言解释器、正则表达式引擎等场景。 在解释器模式中,主要有以下几个角色:① 抽象表达式(AbstractEx…