PDF-Extract-Kit

ops/2024/12/22 2:54:18/

环境安装

conda create -n pdf-extract-kit-1.0 python=3.10
conda activate pdf-extract-kit-1.0
pip install -r requirements.txt

网有点卡,每次下到一半就停了,回宿舍再试试

在这里插入图片描述

模型权重下载

官网
在这里插入图片描述

huggingface-cli download --resume-download opendatalab/PDF-Extract-Kit-1.0 --local-dir .

这个项目好像只能实现简单文本的,还不能拼接,复杂一点的需要使用MinerU


http://www.ppmy.cn/ops/143917.html

相关文章

JS中的innerHTML,innerText,value的区别

目录 Document 对象 主要用途 getElementById() 方法 innerHTML innerText value Document 对象 Document 对象,当 HTML 文档加载到 Web 浏览器中时,它就变成了一个文档对象。文档对象是 HTML 文档的根节点。文档对象是窗口对象的属性。 在JavaSc…

Web 安全 跨站 跨域 XSS CSRF

跨站 跨站即 cross-site,它和同站(same-site)相对,对协议和端口号无要求,只要两个 URL 的 eTLD 1 一致,就能称为同站。那么什么是 eTLD 呢? eTLD 即 effective top level domain,…

《Qt Creator 4.11.1 教程》

《Qt Creator 4.11.1 教程》 一、Qt Creator 4.11.1 概述(一)简介(二)界面构成 二、常用设置指南(一)环境设置(二)文本编辑器设置(三)构建和运行设置 三、构建…

无人机推流直播平台EasyDSS视频技术如何助力冬季森林防火

冬季天干物燥,大风天气频繁,是森林火灾的高发期。相比传统的人力巡查,无人机具有更高的灵敏度和准确性,尤其在夜间或浓雾天气中,依然能有效地监测潜在火源。 无人机可以提供高空视角和实时图像传输,帮助巡…

使用MATLAB判断矩阵是否正定的方法与例程

在 MATLAB 中,可以通过一些方法判断一个矩阵是否为正定矩阵,本文介绍其中的三种方法 文章目录 方法 1: 使用 chol 函数方法 2: 检查特征值方法 3: 使用 ispositivedefinite 函数(需要自定义)总结 方法 1: 使用 chol 函数 chol 函…

React Router常见面试题目

1. React Router 支持哪几种模式? React Router 支持以下两种主要模式: BrowserRouter (基于 HTML5 History API 的模式) 原理: 利用 history.pushState 和 history.replaceState 操作浏览器历史栈,无需重新加载页面。URL 看起来像传统 URL…

移动网络(2,3,4,5G)设备TCP通讯调试方法

背景: 当设备是移动网络设备连接云平台的时候,如果服务器没有收到网络数据,移动物联设备发送不知道有没有有丢失数据的时候,需要一个抓取设备出来的数据和服务器下发的数据的方法。 1.服务器系统是很成熟的,一般是linu…

DNS 服务器是什么?有什么作用

一、DNS 服务器的定义 DNS 服务器即域名系统(Domain Name System)服务器。它是一种在互联网基础设施中扮演关键角色的服务器。在互联网的世界里,每台设备(如服务器、计算机等)都有一个唯一的 IP 地址,就像…