Ollama-OCR:利用视觉语言模型从图像中提取文本

devtools/2024/12/29 5:03:59/

Ollama-OCR利用视觉语言模型从图像中提取文本。

本文将介绍 Ollama-OCR 的关键特点、安装方法、快速开始指南以及输出格式的详细信息。

github:https://github.com/imanoop7/Ollama-OCR

需安装:ollama https://ollama.com/download

特点

  • 支持多种视觉模型:Ollama-OCR 支持包括 LLaVA 7B 和 Llama 3.2 Vision 在内的视觉模型,这些模型能够处理实时和复杂文档的文本识别任务。

  • 多种输出格式:支持输出格式包括 Markdown、纯文本、JSON、结构化数据和键值对格式。

  • 用户友好的界面:提供拖放图片上传、实时处理、下载提取文本和图像预览等功能。

  • 批量处理能力:支持并行处理多个图像,并能跟踪每个图像的处理进度。

整合包

https://pan.quark.cn/s/a22e24638212

快速开始

在使用 Ollama-OCR 之前,需要安装 Ollama 并拉取所需的模型:

ollama pull llama3.2-vision:11b

输出格式详情

  • Markdown 格式:输出为包含从图像中提取的文本的 Markdown 字符串。

  • 文本格式:输出为包含从图像中提取的文本的纯文本字符串。

  • JSON 格式:输出为包含从图像中提取的文本的 JSON 对象。

  • 结构化格式:输出为包含从图像中提取的文本的结构化对象。

  • 键值格式:输出为包含从图像中提取的文本的字典。

Streamlit Web 应用程序

Ollama-OCR 还提供了一个基于 Streamlit 的 Web 应用程序,支持批量处理,具有用户友好的界面,包括拖放图片上传、实时处理、下载提取文本和图像预览等功能。


http://www.ppmy.cn/devtools/146307.html

相关文章

Alma linux部署gitlab

前提条件 操作系统: AlmaLinux 8(或相似版本)内存: 至少 4GB RAM硬盘: 至少 20GB 硬盘空间(建议更多)sudo 权限: 你需要在系统上具有 root 权限,或者是可以使用 sudo 的用户。 步骤 1: 更新系统 首先,更…

mapbox基础,加载mapbox官方地图

👨‍⚕️ 主页: gis分享者 👨‍⚕️ 感谢各位大佬 点赞👍 收藏⭐ 留言📝 加关注✅! 👨‍⚕️ 收录于专栏:mapbox 从入门到精通 文章目录 一、🍀前言1.1 ☘️mapboxgl.Map 地图对象…

JS中类型化数组(Typed Arrays)详解和常见应用场景

在JavaScript中,类型化数组(Typed Arrays) 是用于处理二进制数据的对象。它们允许我们以一种高效的方式操作和存储大量的数值数据,特别适合处理类似于图像、音频、视频等场景的原始二进制数据。 类型化数组的基本概念 类型化数组…

一文了解多云原生的现代化实时数仓 SelectDB Cloud

随着数字化转型的加速,云计算已成为现代企业运营中的关键组成部分。云的重要性体现在多个方面:首先,它提供更好的灵活性与可扩展性,可根据实际需求动态调整计算和存储资源,以快速适应市场变化并支持业务增长。其次&…

R 和 Origin 完成细菌 OTU 表、土壤理化性质数据的微生物 Beta 多样性分析

使用 R 进行分析与可视化 1. 数据准备 假设已经有细菌 OTU 表&#xff08;以表格形式存储&#xff0c;行是样本&#xff0c;列是 OTU&#xff09;和土壤理化性质表&#xff08;行是样本&#xff0c;列是不同的理化性质指标&#xff09;。 # 读取数据 otu_table <- read.c…

2024-05-18 前端模块化开发——ESModule模块化

目录 1、认识 ES Module2、ES Module基本使用3、export关键字 3.1、导出方式一——直接导出3.2、导出方式二——通过as起别名3.3、导出方式三——定义的时候就直接导出 4、import关键字 4.1、导入方式一——直接导入4.2、导入方式二——通过as起别名4.3、导入方式三——可以给…

网络安全离我们不远!

前言 昨天晚上有朋友将公网上的一台 redis 密码设置为 123456&#xff0c;并且觉得没什么影响&#xff0c;再结合我之前毕业设计时被删库勒索&#xff0c;以及工作中碰到的网络安全相关的事情&#xff0c;就有了本篇感想&#xff0c;网络安全离我们并不远&#xff01; 毕设 M…

Edge SCDN酷盾安全重塑高效安全内容分发新生态

在数字化浪潮不断推进的今天&#xff0c;互联网内容的分发效率与安全性已成为企业业务发展的关键要素。酷盾安全推出的Edge Secure Content Delivery Network&#xff08;Edge SCDN&#xff09;&#xff0c;不仅集成了分布式DDoS防护、CC防护、WAF防护及BOT行为智能分析等安全加…