Ollama-OCR：利用视觉语言模型从图像中提取文本

Ollama-OCR：利用视觉语言模型从图像中提取文本

devtools/2024/12/29 5:03:59/

Ollama-OCR利用视觉语言模型从图像中提取文本。

本文将介绍 Ollama-OCR 的关键特点、安装方法、快速开始指南以及输出格式的详细信息。

github:https://github.com/imanoop7/Ollama-OCR

需安装:ollama https://ollama.com/download

特点

支持多种视觉模型：Ollama-OCR 支持包括 LLaVA 7B 和 Llama 3.2 Vision 在内的视觉模型，这些模型能够处理实时和复杂文档的文本识别任务。
多种输出格式：支持输出格式包括 Markdown、纯文本、JSON、结构化数据和键值对格式。
用户友好的界面：提供拖放图片上传、实时处理、下载提取文本和图像预览等功能。
批量处理能力：支持并行处理多个图像，并能跟踪每个图像的处理进度。

整合包

https://pan.quark.cn/s/a22e24638212

快速开始

在使用 Ollama-OCR 之前，需要安装 Ollama 并拉取所需的模型：

ollama pull llama3.2-vision:11b

输出格式详情

Markdown 格式：输出为包含从图像中提取的文本的 Markdown 字符串。
文本格式：输出为包含从图像中提取的文本的纯文本字符串。
JSON 格式：输出为包含从图像中提取的文本的 JSON 对象。
结构化格式：输出为包含从图像中提取的文本的结构化对象。
键值格式：输出为包含从图像中提取的文本的字典。

Streamlit Web 应用程序

Ollama-OCR 还提供了一个基于 Streamlit 的 Web 应用程序，支持批量处理，具有用户友好的界面，包括拖放图片上传、实时处理、下载提取文本和图像预览等功能。

http://www.ppmy.cn/devtools/146307.html

相关文章

Alma linux部署gitlab

Alma linux部署gitlab

前提条件操作系统: AlmaLinux 8（或相似版本）内存: 至少 4GB RAM硬盘: 至少 20GB 硬盘空间（建议更多）sudo 权限: 你需要在系统上具有 root 权限，或者是可以使用 sudo 的用户。步骤 1: 更新系统首先，更…

阅读更多...

mapbox基础，加载mapbox官方地图

mapbox基础，加载mapbox官方地图

👨‍⚕️ 主页： gis分享者 👨‍⚕️ 感谢各位大佬点赞👍 收藏⭐ 留言📝 加关注✅! 👨‍⚕️ 收录于专栏：mapbox 从入门到精通文章目录一、🍀前言1.1 ☘️mapboxgl.Map 地图对象…

阅读更多...

JS中类型化数组（Typed Arrays）详解和常见应用场景

JS中类型化数组（Typed Arrays）详解和常见应用场景

在JavaScript中，类型化数组（Typed Arrays） 是用于处理二进制数据的对象。它们允许我们以一种高效的方式操作和存储大量的数值数据，特别适合处理类似于图像、音频、视频等场景的原始二进制数据。类型化数组的基本概念类型化数组…

阅读更多...

一文了解多云原生的现代化实时数仓 SelectDB Cloud

一文了解多云原生的现代化实时数仓 SelectDB Cloud

随着数字化转型的加速，云计算已成为现代企业运营中的关键组成部分。云的重要性体现在多个方面：首先，它提供更好的灵活性与可扩展性，可根据实际需求动态调整计算和存储资源，以快速适应市场变化并支持业务增长。其次&…

阅读更多...

R 和 Origin 完成细菌 OTU 表、土壤理化性质数据的微生物 Beta 多样性分析

R 和 Origin 完成细菌 OTU 表、土壤理化性质数据的微生物 Beta 多样性分析

使用 R 进行分析与可视化 1. 数据准备假设已经有细菌 OTU 表（以表格形式存储，行是样本，列是 OTU）和土壤理化性质表（行是样本，列是不同的理化性质指标）。 # 读取数据 otu_table <- read.c…

阅读更多...

2024-05-18 前端模块化开发——ESModule模块化

2024-05-18 前端模块化开发——ESModule模块化

目录 1、认识 ES Module2、ES Module基本使用3、export关键字 3.1、导出方式一——直接导出3.2、导出方式二——通过as起别名3.3、导出方式三——定义的时候就直接导出 4、import关键字 4.1、导入方式一——直接导入4.2、导入方式二——通过as起别名4.3、导入方式三——可以给…

阅读更多...

网络安全离我们不远！

网络安全离我们不远！

前言昨天晚上有朋友将公网上的一台 redis 密码设置为 123456，并且觉得没什么影响，再结合我之前毕业设计时被删库勒索，以及工作中碰到的网络安全相关的事情，就有了本篇感想，网络安全离我们并不远！ 毕设 M…

阅读更多...

Edge SCDN酷盾安全重塑高效安全内容分发新生态

Edge SCDN酷盾安全重塑高效安全内容分发新生态

在数字化浪潮不断推进的今天，互联网内容的分发效率与安全性已成为企业业务发展的关键要素。酷盾安全推出的Edge Secure Content Delivery Network（Edge SCDN），不仅集成了分布式DDoS防护、CC防护、WAF防护及BOT行为智能分析等安全加…

阅读更多...

最新文章