ChatGPT与讯飞星火实测对比

news/2025/3/19 13:17:41/

文章目录

  • 一、推理测试
    • 测试提示词1:假设树上有10只鸟,开枪打死1只,那么树上还有几只鸟?
    • - 测试提示词2:一艘船10天可以渡过太平洋,请计算10艘船多少天可以渡过太平洋。
    • 测试提示词3:我爸妈结婚的时候为什么不邀请我
    • 二、格式化输出简单测试
    • 三、计算测试
    • 四、文学测试

讯飞星火认知大模型,无疑是这几天国内最火热的话题之一。为了支持国产,申请了测试账号,今天抽时间进行一轮简单的实测,供大家品鉴。

讯飞星火实测网址:https://xinghuo.xfyun.cn/desk
在这里插入图片描述
今日出场的是:

1.讯飞星火认知大模型

2.ChatGPT的GPT-3.5 Model版本

3.ChatGPT的GPT-4 Model版本
在这里插入图片描述

一、推理测试

测试提示词1:假设树上有10只鸟,开枪打死1只,那么树上还有几只鸟?

1.星火认知大模型 : 正确图片
在这里插入图片描述
2.ChatGPT的GPT-3.5 Model版本 :错误
在这里插入图片描述
3.ChatGPT的GPT-4 Model版本: 正确
在这里插入图片描述
第一轮结果:星火认知大模型结果强过ChatGPT的GPT-3.5 Model版本,与ChatGPT的GPT-4 Model版本打平。

- 测试提示词2:一艘船10天可以渡过太平洋,请计算10艘船多少天可以渡过太平洋。

1.星火认知大模型 : 正确
在这里插入图片描述
2.ChatGPT的GPT-3.5 Model版本 :正确
在这里插入图片描述
3.ChatGPT的GPT-4 Model版本: 正确
在这里插入图片描述

第二轮结果:大家都是对的,打平。

测试提示词3:我爸妈结婚的时候为什么不邀请我

1.星火认知大模型 : 正确
在这里插入图片描述
2.ChatGPT的GPT-3.5 Model版本 :错误
在这里插入图片描述
3.ChatGPT的GPT-4 Model版本: 正确
在这里插入图片描述
第三轮结果:星火认知大模型结果强过ChatGPT的GPT-3.5 Model版本,与ChatGPT的GPT-4 Model版本打平。

二、格式化输出简单测试

测试提示词:我希望你扮演一个电子表格。你只需回复我基于文本的10行excel表,行号和单元格字母作为列(A到L)。第一列标题应该是空的参考行号。我会告诉你要在单元格中写入什么,你将以文本形式回复excel表格的结果,除此之外什么都不用做。不需要描述解释。我会给你写公式,你会执行公式,你只会回复excel表格的结果作为文本。首先,先给我一张空白的表格
1.星火认知大模型 : 错误
在这里插入图片描述
2.ChatGPT的GPT-3.5 Model版本 : 正确
在这里插入图片描述
3.ChatGPT的GPT-4 Model版本: 正确
在这里插入图片描述
本轮测试星火认知大模型明显不如ChatGPT们。

三、计算测试

测试提示词:你现在是一名银行财务,一个用户有500000本金,每年利率增长1%,50年后能拿到多少钱
1.星火认知大模型 : 错误
在这里插入图片描述
2.ChatGPT的GPT-3.5 Model版本 :错误
在这里插入图片描述
3.ChatGPT的GPT-4 Model版本: 正确
在这里插入图片描述
在这里插入图片描述
本轮,只有ChatGPT的GPT-4 Model版本,星火错了。

四、文学测试

1.星火认知大模型 : 差
在这里插入图片描述
2.ChatGPT的GPT-3.5 Model版本 :良
在这里插入图片描述
在这里插入图片描述
3.ChatGPT的GPT-4 Model版本:优
在这里插入图片描述
在这里插入图片描述


http://www.ppmy.cn/news/96903.html

相关文章

Qt - UI进阶

Qt - UI 进阶 布局控件及其坐标pos/position/scenePosition/globalPosition 场景和视图??? 布局 https://blog.csdn.net/kongcheng253/article/details/128769765 控件及其坐标 pos/position/scenePosition/globalPosition pos()函数返回的…

动态组件、插槽、自定义指令、Eslint和prettierrc配置、axios全局挂载

动态组件、插槽、自定义指令、Eslint和prettierrc配置、axios全局挂载 动态组件插槽体验插槽的基础用法作用域插槽 自定义指令Eslint和prettierrc配置prettierrc axios全局挂载 动态组件 动态组件指的是动态切换组件的显示与隐藏。 如何实现动态组件渲染 vue 提供了一个内置的…

《Spring Guides系列学习》guide51 - guide55

要想全面快速学习Spring的内容,最好的方法肯定是先去Spring官网去查阅文档,在Spring官网中找到了适合新手了解的官网Guides,一共68篇,打算全部过一遍,能尽量全面的了解Spring框架的每个特性和功能。 接着上篇看过的gui…

英睿达内存条正品鉴别教程(镁光颗粒)

我们打算买一款二手镁光颗粒的英睿达内存条,需要从正面内存标签上的条形码、字串,从背面颗粒上的两行字符一一分析、检查、鉴别,最终确认是否正品,以及内存条等级如何。通过本片文章,您能学会如何进行镁光颗粒的英睿达内存条正品鉴别。 一、标签检查 首先,用百度条形码…

HTML+CSS实训——Day03——仿网易云音乐的发现页界面

仓库链接:https://github.com/MengFanjun020906/HTML_SX 一些今天需要用到的知识点 弹性盒子 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta http-equiv"X-UA-Compatible" content"IEedg…

如何在华为OD机试中获得满分?Java实现【字符串重新排序】一文详解!

✅创作者&#xff1a;陈书予 &#x1f389;个人主页&#xff1a;陈书予的个人主页 &#x1f341;陈书予的个人社区&#xff0c;欢迎你的加入: 陈书予的社区 &#x1f31f;专栏地址: Java华为OD机试真题&#xff08;2022&2023) 文章目录 1、题目描述2、输入描述3、输出描述…

根据DataFrame1中指定列c1的每个值a1 从DataFrame2中指定列c2中的每个值a2 找到与a1最临近的值a2,进行所在行合并

【小白从小学Python、C、Java】 【计算机等级考试500强双证书】 【Python-数据分析】 根据DataFrame1中指定列c1的每个值a1 从DataFrame2中指定列c2中的每个值a2 找到与a1最临近的值a2,进行所在行合并 [太阳]选择题 关于以下代码说法错误的是&#xff1a; import pandas as pd…

第三章、测试需求分析

本课程目标 1.什么是软件测试需求 2.软件测试需求的必要性 3.如何对软件测试需求进行分析(重点) 软件测试的流程 需求分析测试计划软件测试设计软件测试执行测试评估一、测试需求是什么 测试需求主要解决“测什么”的问题,一半来自需求规格说明书中原始需求测试需求应全…