在ubuntu22.04上部署RagFlow一个深度文档理解的开源 RAG

devtools/2024/10/18 8:30:49/

RAGFlow 是一个基于深度文档理解的开源 RAG(Retrieval-Augmented Generation)引擎。它为任何规模的企业提供简化的 RAG 工作流程,结合 LLM(大型语言模型)以提供真实的问答功能,并由来自各种复杂格式数据的有根据的引用提供支持。

主要特点
1、“品质进,品质出”
基于深度文档理解,从具有复杂格式的非结构化数据中提取知识。
找到“数据大海捞针”,字面上是无限的令牌。
2、 基于模板的分块
智能且可解释。
大量模板选项可供选择。
3、 接地引文,减少幻觉
文本分块的可视化,允许人为干预。
快速查看关键参考文献和可追溯的引文,以支持有根据的答案。
4、 与异构数据源的兼容性
支持 Word、幻灯片、excel、txt、图像、扫描副本、结构化数据、网页等。
5、 自动化且轻松的 RAG 工作流程
简化的 RAG 编排可满足个人和大型企业的需求。
可配置的 LLM 以及嵌入模型。
多次召回与融合重新排名配对。
直观的 API,可与业务无缝集成。

下面我们就开始介绍部署

一、软件硬件要求
CPU >= 4 核
RAM >= 16 GB
磁盘 >= 50 GB
Docker >= 24.0.0 和 Docker Compose >= v2.26.1

Docker安装

sudo apt-get install docker.io

docker-compose的安装

curl -L "https://github.com/docker/compose/releases/download/v2.29.1/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose

 设置系统参数

systemctl enable docker
systemctl start docker

二、以docker方式安装RagFlow

1、系统参数设置

# In this case, we set it to 262144:
$ sudo sysctl -w vm.max_map_count=262144

2、克隆代码

$ git clone https://github.com/infiniflow/ragflow.git

3、构建预构建的 Docker 镜像并启动服务器:

$ cd ragflow/docker
$ chmod +x ./entrypoint.sh
$ docker compose up -d

如果你非常幸运,但么执行完上面就安装完了,但因为众所周知的不知道什么原因,如果无法下载docker镜像文件,小伙伴可以从我们百度网盘下载:

链接:https://pan.baidu.com/s/1afq0C2fTyoctU2df2Uhs8g?pwd=jw5f 
提取码:jw5f 

下载后,执行下面的导入镜像文件

#下载五个docker文件,并安装
docker load -i [文件名]

然后再执行:

$ cd ragflow/docker
$ chmod +x ./entrypoint.sh
$ docker compose up -d

三:运行及设置

运行直接打开浏览器,输入IP地下即可。

http://ip:80

 首次登录,需要注册一个帐号。

四:设置LLM

这里就具体说了,我是选了本地的ollama,

使用本地ollama,这里的API-Key可以不填。

五:结束语

我们先后介绍了FastGPT、Flowise和今天我们介绍的RagFlow。大家可以对比测试一下,看看哪个功能更多,更好用。


http://www.ppmy.cn/devtools/99323.html

相关文章

【嵌入式开发之网络编程】TCP端口和UDP端口

目录 网络端口的定义及作用 运输层的作用 运输层的两个主要协议 用户数据报协议UDP (User Datagram Protocol) 传输控制协议TCP (Transmission Control Protocol) 运输层的端口及分类 按照端口号分类 按照协议类型分类 BSD端口 网络端口的定义及作用 在网络技术中…

(第三期)书生大模型实战营——OpenXLab部署InternLM2实践——上传模型

OpenXLab 部署 InternLM2 实践指南 上传模型 初始化git设置 # install git sudo apt-get update sudo apt-get install git# install git lfs sudo apt-get update sudo apt-get install git-lfs# use git install lfs git lfs installOpenXLab 使用你在平台的用户名作为 Git…

设计模式-结构型模式(第五章)

目录 5、结构型模式 5.1 代理模式 5.1.1 概述 5.1.2 结构 5.1.3 静态代理 5.1.4 JDK动态代理 5.1.4 JDK动态代理 5.1.5 CGLIB动态代理 5.1.6 三种代理的对比 5.1.7 优缺点 5.1.8 使用场景 5.2 适配器模式 5.2.1 概述 5.2.2 结构 5.2.3 类适配器模式 5.2.4 对象适…

R语言function快速掌握-自定义函数

R语言在生物学中运用的比较多的还是吊包然后使用内置函数进行一次性工作,但是生物信息与计算生物学领域确实低估和忽视了R语言在循环和自定义函数方面的优势。 在R语言中,function 是一个核心概念,它允许用户创建可重用的代码块来执行特定的…

怎么打包git提交版本

Git 将指定的提交版本到现在的文件导出为zip/tar包 在本文中,我们将介绍如何使用 Git 来将指定的提交版本到现在的文件导出为 zip 或 tar 包。Git 是一个分布式版本控制系统,它可以帮助我们记录和管理项目的历史变更,包括文件的新增、修改和删…

Windows-Server-2016/2019绕过WindowsDefender

当获得了一个webshell的时候,下一步要反弹个shell回来 在尝试了https://github.com/trustedsec/unicorn独角兽失败之后,找到了一篇使用golang将shellcode注入到内存的文章 Bypassing Antivirus with Golang - Gopher it! | JUMPSEC LABS GitHub - brimst…

读软件开发安全之道:概念、设计与实施07密码学(上)

1. 加密工具 1.1. 加密工具之所以没有得到充分使用,就是因为人们往往认为密码学是一个准入门槛极高的专业领域 1.2. 如今的加密学大部分都源自纯数学,所以只要能够正确使用,加密学确实行之有效 1.2.1. 不代表这些算法本身确实无法破解&…

lvs+keepalive大战haproxy+keepalive实现高可用集群

华子目录 lvskeepalive实验架构实验前的准备工作1.主机准备2.KA1和KA2上安装lvskeepalive3.webserver1和webserver2上安装httpd4.制作测试效果网页内容5.所有主机关闭firewalld和selinux6.开启httpd服务 实验步骤1.webserver1和webserver2上配置vip2.webserver1和webserver2上关…