使用NAS开启无纸化办公,Docker部署开源文档管理系统『Paperless-ngx』

devtools/2024/11/29 21:12:47/

使用NAS开启无纸化办公,Docker部署开源文档管理系统『Paperless-ngx』

哈喽小伙伴们好,我是Stark-C~

对于文案类的办公场景来说,手头堆放最多的可能就是各种文档文件,以及各种用过的打印废纸。

这么多年来,不管是领导还是员工,都希望能够使用数字化管理做到无纸化办公,抛开环保不谈,更重要的是它能节约成本开支,便于管理与提高效率。这种管理工具市面上不多,并且基本还是收费的。

今天为大家分享的这个项目『Paperless-ngx』就是一款非常不错的无纸化办公管理工具,可以轻松管理我们日常常见的各类文档,最重要的是,它还是免费开源,支持本地私有化部署也保障了文档的安全性。

关于Paperless-ngx

🔺当我们看到Paperless-ngx标识的时候,第一眼看到的绿叶就说明它的功能亮点:绿色环保(也就是它倡导的“无纸化”),实时上它对于很多职场人士来说,确实可以做到无纸化办公。简单谈说,它其实就是帮助用户实现无纸化办公和文档数字化管理工具,其核心功能包括:

  • 文档的组织与索引:通过标签、对应者、类型等多种方式组织扫描文档。

  • OCR文本识别:对文档进行光学字符识别,使包含图像的扫描文档也能搜索和选择文本。

  • 多语言支持:利用开源的Tesseract引擎,支持100多种语言。

  • 长期存储格式:文档以PDF/A格式保存,设计用于长期存储。

  • 智能标签与分类:使用机器学习自动添加标签、对应者和文档类型。

  • 广泛的文件支持:支持PDF文档、图像、纯文本文件、Office文档等。

  • 定制化的文件管理:Paperless-ngx管理文件名和文件夹,支持不同的配置。

  • 现代化的网页应用:定制仪表板、过滤器、批量编辑、拖放上传、自定义视图、共享链接等。

  • 全文搜索:自动完成、相关性排序、高亮显示匹配查询的部分。

  • 电子邮件处理:从电子邮件账户导入文档,配置多个账户和规则。

  • 多用户权限系统:内置健壮的多用户权限系统。

  • 多核系统优化:并行处理多个文档。

然后引用下其他网友总结出来的几个较为常见且实用的使用场景:

个人文件管理:无论是家庭账单、保险合同还是医疗报告,Paperless-ngx 都能帮你把纸质文件变成可搜索的电子文件,告别纸质文件的烦恼。

企业档案管理:对于企业来说,文件量庞大且分类复杂,而Paperless-ngx 的OCR和标签功能让档案的整理和查找都更有效率。特别适合中小企业,降低文件管理成本。

教育与研究:对于学术机构或研究人员来说,海量的研究报告、会议纪要和参考资料都可以借助 Paperless-ngx 进行存档和检索,为学术研究提供支持。

它还提供了演示Demo,有兴趣的小伙伴可以先体验再部署:https://demo.paperless-ngx.com/

Paperless-ngx部署

部署前的准备:

需要说明的是,今天的这个项目需要多大5个容器同时联动和配合,所以我们可以简单的使用Docker Compose即可轻松部署,而在极空间上使用Docker Compose,最简单的方案莫过于Portainer了。

🔺极空间自从上次更新上线SSH功能以后,可玩性和功能性大大增强。我也是第一时间给大家分享了它的一些基本玩法和注意事项,其中就包括Portainer的部署:

按照文中教程,部署好Portainer以及了解它的基本用法还是没有问题的。

我这里再次多嘴提醒下绝大多数的普通用户:如果你只是为了使用命令部署Docker,就和我一样在部署好Portainer之后关掉极空间的SSH功能,一个是因为安全问题,另一个是防止自己误删极空间的系统文件导致系统问题。在Portainer中支持所有容器的命令和图像化部署,哪怕不是Compose命令,大家也可以通过【composerize】官网在线转换,非常方便!

另外就是Portainer是在使用命令部署容器的时候也是需要拉取Docker镜像,所以必要的代理和网络还是少不了的,要不然也会失败,这里就不讨论了~

🔺然后在极空间的Docker目录下新建一个“paperlessngx”的文件夹,在paperlessngx文件夹下面在新建 consume、data、db、export、media、redis、trash总共7个子文件夹。

开始部署:

🔺完成准备工作之后打开Portainer,选择“堆栈--添加堆栈”。

🔺名称随意,在Web编辑器中输入以下命令(直接复制粘贴即可,注意格式很重要):

services:redis:image: redis:7command:- /bin/sh- -c- redis-server --requirepass redispasscontainer_name: PaperlessNGX-REDIShostname: paper-redismem_limit: 512mmem_reservation: 256mcpu_shares: 768security_opt:- no-new-privileges:trueread_only: trueuser: 0:0    # 用户UID和GID,极空间用户不用改,其它NAS用户请自行修改healthcheck:test: ["CMD-SHELL", "redis-cli ping || exit 1"]volumes:- ./Docker/paperlessngx/redis:/data:rw    # 映射redis文件夹实际路径environment:TZ: Asia/Shanghairestart: unless-stopped
​db:image: postgres:17container_name: PaperlessNGX-DBhostname: paper-dbmem_limit: 1gcpu_shares: 768security_opt:- no-new-privileges:truehealthcheck:test: ["CMD", "pg_isready", "-q", "-d", "paperless", "-U", "paperlessuser"]timeout: 45sinterval: 10sretries: 10volumes:- ./Docker/paperlessngx/db:/var/lib/postgresql/data    # 映射db文件夹实际路径environment:POSTGRES_DB: paperlessPOSTGRES_USER: paperlessuserPOSTGRES_PASSWORD: paperlesspassrestart: unless-stopped
​gotenberg:image: gotenberg/gotenberg:latestcontainer_name: PaperlessNGX-GOTENBERGhostname: gotenbergsecurity_opt:- no-new-privileges:trueuser: 0:0    # 用户UID和GID,极空间用户不用改,其它NAS用户请自行修改command:- "gotenberg"- "--chromium-disable-javascript=true"- "--chromium-allow-list=file:///tmp/.*"restart: unless-stopped
​tika:image: ghcr.io/paperless-ngx/tika:latestcontainer_name: PaperlessNGX-TIKAhostname: tikasecurity_opt:- no-new-privileges:trueuser: 0:0    # 用户UID和GID,极空间用户不用改,其它NAS用户请自行修改restart: unless-stopped
​paperless:image: ghcr.io/paperless-ngx/paperless-ngx:latestcontainer_name: PaperlessNGXhostname: paperless-ngxmem_limit: 6gcpu_shares: 1024security_opt:- no-new-privileges:truehealthcheck:test: ["CMD", "curl", "-fs", "-S", "--max-time", "2", "http://localhost:8000"]interval: 30stimeout: 10sretries: 5ports:- 8000:8000    # 项目打开端口,冒号前面请勿和本地冲突volumes:- ./Docker/paperlessngx/data:/usr/src/paperless/data    # 映射data文件夹实际路径- ./Docker/paperlessngx/media  :/usr/src/paperless/media    # 映射media文件夹实际路径- ./Docker/paperlessngx/export:/usr/src/paperless/export    # 映射export文件夹实际路径- ./Docker/paperlessngx/consume:/usr/src/paperless/consume    # 映射consume文件夹实际路径- ./Docker/paperlessngx/trash:/usr/src/paperless/trash    # 映射trash文件夹实际路径environment:PAPERLESS_REDIS: redis://:redispass@paper-redis:6379PAPERLESS_DBENGINE: postgresqlPAPERLESS_DBHOST: paper-dbPAPERLESS_DBNAME: paperlessPAPERLESS_DBUSER: paperlessuserPAPERLESS_DBPASS: paperlesspassPAPERLESS_EMPTY_TRASH_DIR: ../trashPAPERLESS_FILENAME_FORMAT: '{{ created_year }}/{{ correspondent }}/{{ document_type }}/{{ title }}'PAPERLESS_OCR_ROTATE_PAGES_THRESHOLD: 6PAPERLESS_TASK_WORKERS: 1USERMAP_UID: 0    # 用户UID,极空间用户不用改,其它NAS用户请自行修改USERMAP_GID: 0    # 用户GID,极空间用户不用改,其它NAS用户请自行修改PAPERLESS_TIME_ZONE: Asia/ShanghaiPAPERLESS_ADMIN_USER: stark-c    # 默认管理员用户名PAPERLESS_ADMIN_PASSWORD: 123456    # 默认管理员密码PAPERLESS_OCR_LANGUAGES: chi-sim chi-traPAPERLESS_OCR_LANGUAGE: eng+chi_simPAPERLESS_TIKA_ENABLED: 1PAPERLESS_TIKA_GOTENBERG_ENDPOINT: http://gotenberg:3000PAPERLESS_TIKA_ENDPOINT: http://tika:9998restart: unless-stoppeddepends_on:db:condition: service_healthyredis:condition: service_healthytika:condition: service_startedgotenberg:condition: service_started

以上代码需要根据注释自行修改,其它没有注释的如果不懂请不要乱动。

🔺修改好之后点击页面底部的“部署堆栈”。

🔺等待的时间稍长,如果不出意外,就能看到这个项目中的5个容器都在正常运行。

Paperless-ngx体验

🔺打开方式依然是常规的【极空间本地IP:端口号】即可,首次打开需要输入用户名和密码,也就是我们部署容器时环境变量中自己设置的账户密码。

🔺登录进来之后就可以看到它默认显示的就是我们部署时候的用户名信息,并且原生都是中文显示。

🔺我这里尝试先上传一个Word文档,直接在首页(仪表盘)这里点击上传,或者拖拽都可以。

🔺几秒钟的时间,文件就会出现在“文档”菜单。

🔺点开可以直接查看,同时还能OCR识别。可以看到它对文字类的OCR识别可以说是做到了准确率极高,几乎没有漏掉和错误。

🔺多用户还能方便在这里编辑权限。

🔺同样的方法,我上传了一张照片并打开。

🔺可以看到照片中的文字也被成功识别。

🔺不过稍微复杂的图片文字就少点意思了,并且明显英文的识别率要高于中文很多。

🔺对于TXT格式的文档支持的也非常不错,比如说我这里上传的一段Docker Compose.yaml代码,夹杂着中文注释,它都是完美支持。

🔺最后看看对于PDF的支持,依然没任何问题,并且OCR识别同样准确率很高。

🔺它还有一个很好的功能就是智能搜索,给出关键字,很快就能找到我们保存在上面的文档。

🔺有点遗憾的是它目前不支持我写文章的Markdown格式,如果后期支持那就太合我意了!

最后

今天分享的这个项目还是非常实用了,它可以让我们更好地管理他们的文档,提高生产力,减少纸张使用,不管是对企业还是个人都是一个实用的解决方案,有兴趣的小伙伴可以整起来了!

最近正逢极空间双十一感恩回馈大促销活动,极空间的多款产品都有好价。如果你近期有入手NAS的计划,不妨关注下极空间。

好了,以上就是今天给大家分享的内容,我是爱分享的Stark-C,如果今天的内容对你有帮助请记得收藏,顺便点点关注,咱们下期再见!谢谢大家~


http://www.ppmy.cn/devtools/138016.html

相关文章

SAP开发语言ABAP开发入门

1. 了解ABAP开发环境和基础知识 - ABAP简介 - ABAP(Advanced Business Application Programming)是SAP系统中的编程语言,主要用于开发企业级的业务应用程序,如财务、物流、人力资源等模块的定制开发。 - 开发环境搭建 - 首先需…

CodeIgniter如何手动将模型连接到数据库

在CodeIgniter中,模型通常是自动与数据库连接的,因为模型类(CI_Model)已经内置了对数据库操作的支持。但是,如果你需要手动指定数据库连接或者进行一些特殊的数据库配置,你可以通过几种方式来实现。 1. 使…

ISIS SSN/SRM 标志在 P2P 链路和 Broadcast 链路中的作用

LSDB content 链路状态数据库内容 Each router maintains a separate LSDB for level-1 and level-2 LSPs 每个路由器为一级和二级 LSP 维护一个单独的 LSDB LSP headers and contents LSP 头部和内容 SRM Send Routeing Message SRM 发送路由消息 SSN Send Sequence Numbe…

建造者模式Builder——优雅的使用姿势

在面向对象设计中,建造者模式(Builder Pattern) 是一种非常经典的设计模式,特别适用于需要构造复杂对象的场景。Lombok 提供的 Builder 注解极大简化了 Builder 模式的实现,而 toBuilder true 则进一步增强了它的灵活…

记录一次在生产环境中更换 SSL 证书的操作

本文将记录一次在生产环境中更换 SSL 证书的过程,包括准备工作、遇到的问题和解决方案,以及如何重启和重新加载 Nginx 服务以使更改生效。 1. 确认证书过期 SSL 证书通常具有有效期,当证书过期时,用户访问网站时会看到浏览器警告…

Jmeter中的监听器

3)监听器 1--查看结果树 用途 调试测试计划:查看每个请求的详细信息,帮助调试和修正测试计划。分析响应数据:查看服务器返回的响应数据,验证请求是否成功。检查错误:识别和分析请求失败的原因。 配置步骤…

MySQL Crash 故障记录:Failing assertion: index->table->stat_initialized

MySQL Crash 故障记录:Failing assertion: index->table->stat_initialized 1.错误日志 记录一例 MySQL Crash 故障,数据库版本:MySQL Percona Server 5.7.19,Error log 如下: -- Crash 部分日志 2024-11-12 1…

Microsoft Excel如何插入多行

1.打开要编辑的excel表,在指定位置,鼠标右键点击“插入”一行 2.按住shift键,鼠标的光标箭头会变化成如下图所示 3.一直按住shift键和鼠标左键,往下拖动,直至到插入足够的行