DeepSeek学术写作测评第二弹:数据分析、图表解读,效果怎么样?

news/2025/1/30 8:20:26/

我是娜姐 @迪娜学姐 ,一个SCI医学期刊编辑,探索用AI工具提效论文写作和发表。

图片

针对最近全球热议的DeepSeek开源大模型,娜姐昨天分析了关于论文润色、中译英的详细效果测评:

DeepSeek学术写作测评第一弹:论文润色,中译英效果如何?   


和AI界三大巨头相比,较短的训练时间,1/20的芯片数量,效果居然能这么好。

尤其是现在Scaling law现在已经到了瓶颈期,deepseek独辟蹊径的训练方法,确实让人眼前一亮,也给这些AI从业者更多信心和启发。不得不服气!          

今天娜姐继续分析一下大家呼声很高的数据分析、图表解读,这两个场景下DeepSeek表现如何?
          

1 数据分析

经常有同学,特别是医生,面临的情况是,想要发文章,也有数据,但是不知道该怎么分析,从哪里下手,才能找到写论文的突破口和角度。AI能不能给我一些好的思路和建议?

之前娜姐测试过ChatGPT o1版本的数据分析效果:              

ChatGPT-o1用来进行数据分析,对比效果很惊人!                


DeepSeek R1推理模型,在数学推理、代码生成和数据分析等领域表现出色。这篇就来详细测评一下。

我上传了一份有1.6万个药物评价的数据集,让DeepSeek R1进行分析,帮我找到一些有意义的数据特征:

图片

数据太大,DeepSeek R1只分析了前1%也就是1000多条,并向我展示了思考过程:              

图片

          

这个自主思考过程看上去还是很不错的:

首先解读我的表格项目有哪些,然后再次确认我的目的—发表高水平论文,然后再帮我分析可能的方向,最后给出了三个选题方向:    

图片

          

之前ChatGPT的测试,4o给出了4个选题建议,和DeepSeek是重合的,而ChatGPT o1则一口气给出了10个相关选题,包括目标、方法和预期结果:

ChatGPT o1的回复:    

图片

          

接下来,针对某一个选题,我想要DeepSeek o1帮我设计实验,开展数据分析:    

图片

    

图片

    

图片

    

图片

给出的操作步骤非常详细完整。关于统计学方法的选择、统计数据的获取,我想要DeepSeek给我更详细的指导:    

图片

图片

    

图片

这个指导也还不错,让我的思路瞬间清晰了。

          

关于图表制作,我也想要它帮我手把手设计:    

图片

    

图片

    

图片

    

图片

          

总体来看,DeepSeek的回复质量比ChatGPT o1稍弱,但是比ChatGPT 4o强。关键是DeepSeek是开源模型,使用便宜方便。

2 图表解读    

这也是大家的高频需求。图表我都制作完成了,想让AI帮我分析一下,帮我写论文结果部分的图表分析内容,之前娜姐写过:Claude 3.5,ChatGPT都干的不错:

Claude 3.5 升级:论文数据分析就用它了!

我的论文数据分析有救了!看ChatGPT如何帮你分析图表


来看看DeepSeek的图表解读效果如何:          

纳入人群特征分析:

图片

各项数据特征解读准确,目的分析非常合理。

          

继续看其他类型图表的解读:          

LC-MS图谱分析:    

图片

分析结果解读完全正确,甚至“结论与展望”部分还对接下来要展现的图表进行了准确预判,非常智能。

          

PCA得分图分析:    

图片

DeepSeek R1整个解读思路非常清晰,结果解读准确;

并且更绝的是它记得之前的纳入人群的表格数据,还会在后续分析中引入之前的数据;结论部分除了对图片结果进行总结,还对接下来的通路富集分析进行了预判,非常的智能!

          

总结一下:

关于数据分析,DeepSeek比ChatGPT 4o强,比o1稍弱。

关于论文图表解读,DeepSeek表现非常好,完全可以胜任!

          

下一篇,娜姐继续测评学术问答和学术内容写作中,DeepSeek的表现。


http://www.ppmy.cn/news/1567844.html

相关文章

DeepSeek R1中提到“知识蒸馏”到底是什么

在 DeepSeek-R1 中,知识蒸馏(Knowledge Distillation)是实现模型高效压缩与性能优化的核心技术之一。在DeepSeek的论文中,使用 DeepSeek-R1(教师模型)生成 800K 高质量训练样本,涵盖数学、编程、…

将 OneLake 数据索引到 Elasticsearch - 第 1 部分

作者:来自 Elastic Gustavo Llermaly 学习配置 OneLake,使用 Python 消费数据并在 Elasticsearch 中索引文档,然后运行语义搜索。 OneLake 是一款工具,可让你连接到不同的 Microsoft 数据源,例如 Power BI、Data Activ…

国内优秀的FPGA设计公司主要分布在哪些城市?

近年来,国内FPGA行业发展迅速,随着5G通信、人工智能、大数据等新兴技术的崛起,FPGA设计企业的需求也迎来了爆发式增长。很多技术人才在求职时都会考虑城市的行业分布和发展潜力。因此,国内优秀的FPGA设计公司主要分布在哪些城市&a…

算法随笔_31:移动零

上一篇:算法随笔_30: 去除重复字母-CSDN博客 题目描述如下: 给定一个数组 nums,编写一个函数将所有 0 移动到数组的末尾,同时保持非零元素的相对顺序。 请注意 ,必须在不复制数组的情况下原地对数组进行操作。 示例 1: 输入: nums [0,1,…

windows远程调用shell脚本

在Windows系统中远程调用Shell脚本通常涉及到几个步骤,因为Windows本身并不直接支持Shell脚本(如Bash脚本)。但是,你可以通过以下几种方式来实现这一目标: 方法1:使用Cygwin或Git Bash 安装Cygwin或Git Ba…

学习std::is_base_of笔记

1、std::is_base_of简介 在现代 C 中,模板元编程(Template Metaprogramming)是一种非常强大的编程技巧,它让我们能够在编译期进行类型推导和约束。而 std::is_base_of 是一个重要的工具,可以用来检查一个类型是否是另…

Python 函数魔法书:基础、范例、避坑、测验与项目实战

Python 函数魔法书:基础、范例、避坑、测验与项目实战 内容简介 本系列文章是为 Python3 学习者精心设计的一套全面、实用的学习指南,旨在帮助读者从基础入门到项目实战,全面提升编程能力。文章结构由 5 个版块组成,内容层层递进…

使用国内镜像加速器解决 Docker Hub 拉取镜像慢或被屏蔽的问题

一、问题背景 Docker Hub 是 Docker 默认的镜像仓库,但由于网络限制,国内用户直接拉取镜像可能面临以下问题: 下载速度极慢(尤其是大镜像)。连接超时或完全被屏蔽(部分网络环境)。依赖国外源的…