Claude发布桌面客户端!新功能支持分析100页PDF的图像!

devtools/2024/11/6 22:00:16/

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,专注于分享AI全维度知识,包括但不限于AI科普AI工具测评AI效率提升AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。

对于AI工具来说,桌面客户端的重要性正在逐渐提升。

首先是老大哥OpenAI,5月发布了Mac版本的ChatGPT桌面客户端,10月发布了Windows版桌面客户端。

同样是今年10月,AI搜索领域的王者选手Perplexity发布了其首个原生Mac版本桌面客户端。

同同同样是今年10月,OpenAI强有力的竞争对手——Anthropic,发布了Claude桌面客户端,包括Mac和Win两个版本。

1. Claude桌面客户端

下载地址:https://claude.ai/download

随着Claude桌面客户端的发布,Claude应用家族就集齐了iOS、安卓两个移动端app,Mac、Win两个PC客户端,以及web网页端。

经常使用Claude的小伙伴可以按照上面的链接按需下载安装。

虽然Claude发布桌面版客户端值得称赞,但遗憾的是,本次发布的Claude桌面版并非传统意义上的原生应用,而是一个基于Electron框架开发的跨平台应用。简单来说,就是把Claude网页端功能封装在这个桌面应用中,以实现在PC上直接运行Claude,无需再通过浏览器。这种方式以超高的开发效率实现跨平台的支持,但不可避免的有着资源占用高(主要是内存)、性能可能不如原生应用的缺点。

即使如此,如果你是一个Claude重度用户,还是很推荐Claude桌面客户端,毕竟不再需要每次都“打开浏览器”>“打开Claude网页”>“登录”使用了。并且,和ChatGPT桌面客户端一样,Claude桌面客户端也有用于快速呼出的快捷键。Mac版本的快捷键是Option+Space,Win版快捷键是Ctrl+Alt+Space

不论你处于PC的什么界面,在键盘上输入上述快捷键后,都会出现Claude的问题输入窗口,便于随时随地提问。

2. Claude新功能支持分析100页PDF的图像

10月24日,Claude发布了一个非常实用的功能:数据分析。支持csv格式的输入数据,能够直接运行JavaScript代码来进行读取、解析、重构等数据分析。

当时,数据分析功能还仅支持csv格式。一周后的今天,Claude官方新增了对PDF格式的支持,包括PDF文件中的图像、图表和图形!PDF的最大页数目前支持100页!

这个功能和之前的数据分析功能一样,都是处于Beta阶段,位于Claude的Feature Preview版块,需要手动操作打开该功能。

https://claude.ai/new?fp=1

可以直接通过上面的链接进入Feature Preview页面,然后选择Visual PDFs,把开关按钮打开即可。也可以在设置里进入这个页面。

视觉PDF这一功能看似和原有的多模态重复了,但其实不然。之前大多数AI模型的多模态对PDF的支持仅限于文字版PDF,或由word文档转为的PDF。而对于扫描版PDF,及由图片直接生成的PDF,大多数模型是不直接支持的。主要是因为要想理解扫描版PDF中的内容,需要经过转化这一步骤。首先要把PDF的每一页转化为图片,然后由AI模型的多模态能力来解析图片内容,最终整合为PDF的解析。

Claude新增的这一功能原理也是如此。系统首先会提取PDF文件的内容,即把每一页转换为图像,同时提取每页的文本。接着由Claude模型进行内容分析,不仅理解文档中的文字内容,还可以处理图表、图片等视觉元素。并且,Claude的这个视觉PDF功能可以结合Claude的其他功能使用,如提示缓存、批量处理和工具调用等等。

目前仅最新版本的Claude 3.5 Sonnet模型(claude-3-5-sonnet-20241022)支持视觉PDF功能。并且,PDF的大小限制:最大32MB;页数最多支持100页的PDF文件。

结语

最后说明一下很多小伙伴的疑问,对于免费用户,Claude目前实行的是动态调整默认模型,当计算资源紧张时,免费用户能用的模型将从Claude 3.5 Sonnet切换至小模型Claude 3.5 Haiku。当资源充足时,会自动切换回来。


精选推荐


都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。


http://www.ppmy.cn/devtools/131849.html

相关文章

「Mac畅玩鸿蒙与硬件22」鸿蒙UI组件篇12 - Canvas 组件的动态进阶应用

在鸿蒙应用中,Canvas 组件可以实现丰富的动态效果,适合用于动画和实时更新的场景。本篇将介绍如何在 Canvas 中实现动画循环、动态进度条、旋转和缩放动画,以及性能优化策略。 关键词 Canvas 组件动态绘制动画效果动态进度条旋转和缩放性能优…

信息学科平台系统开发:Spring Boot实用指南

3系统分析 3.1可行性分析 通过对本基于保密信息学科平台系统实行的目的初步调查和分析,提出可行性方案并对其一一进行论证。我们在这里主要从技术可行性、经济可行性、操作可行性等方面进行分析。 3.1.1技术可行性 本基于保密信息学科平台系统采用Spring Boot框架&a…

数据库基础(6) . DDL

3.2.DDL 数据定义语言 DDL : Data Definition Language 用于创建新的数据库、模式(schema)、表(tables)、视图(views)以及索引(indexes)等。 常见的DDL语句包括SHOW、CREATE、DRO…

Spring Boot驱动的导师双选系统:设计与实现

第一章 绪论 1.1 选题背景 如今的信息时代,对信息的共享性,信息的流通性有着较高要求,尽管身边每时每刻都在产生大量信息,这些信息也都会在短时间内得到处理,并迅速传播。因为很多时候,管理层决策需要大量信…

聚合 SDK 广告的工作原理及优势

聚合 SDK 广告的工作原理通常包括以下几个主要步骤: 1. 集成聚合 SDK:开发者将聚合 SDK 集成到其应用程序中。 2. 配置参数:开发者在聚合 SDK 中设置各种参数,例如广告平台的优先级、广告类型偏好、出价策略等。 3. 应用启动与请…

Python实例:爱心代码

前言 在编程的奇妙世界里,代码不仅仅是冰冷的指令集合,它还可以成为表达情感、传递温暖的独特方式。今天,我们将一同探索用 Python 语言绘制爱心的神奇之旅。 爱心,这个象征着爱与温暖的符号,一直以来都在人类的情感世界中占据着特殊的地位。而通过 Python 的强大功能,…

算子级血缘助企业数据管理“自动化、精细化、智能化”

经过这么多年的数字化转型,数据已成为驱动企业决策优化和运营效能提升的核心要素。在这个过程中,数据的发掘和利用,已经成为企业实现精细化运营、智能化决策的重要环节。因此,构建一个更高效、全面、精准的数据管理体系&#xff0…

sqlalchemy连接mysql数据库

create_engine() 是 SQLAlchemy 中用于创建数据库连接的函数,它接受多个参数来配置连接池、日志输出等方面。你提到的 create_engine(DATABASE_URI, echoTrue, pool_size5, max_overflow2, pool_timeout30) 中的各个参数的含义如下: 1. DATABASE_URI 意…