ChatGPT如何提升数据开发效率

news/2024/12/29 20:09:14/

目录

一、ChatGPT介绍

二、ChatGPT数据应用场景

A、Pyspark代码样例生成

B、Python设计模式推荐

C、Python代码修复能力

D、异常代码的检测​编辑

E、测试数据内容生成

F、数据分析能力

G、报告生成展示

三、结语 


一、ChatGPT介绍

1、GPT是什么:大型语言预训练模型、具有语言交互能力、提高工作效率工具。

2、GPT演进过程:

ChatGPT和ChatGPT-4区别:

总结:如果你需要非常精确的模型调优和图像识别,GPT-4是可满足,否则普通人GPT-3就足够用了。

 3、GPT能辅助数据开发做什么:

a、规则性代码类生成:正则表达式、API代码生成、代码优化修复等。

b、测试数据内容生成:单表Mock数据生成、多表Mock数据生成,数据修复能力等。

c、数据分析报告生成: 简单数据样例内容分析【无法分析Excel内容,涉及数据安全】

二、ChatGPT数据应用场景

A、Pyspark代码样例生成

语言输入:

利用pyspark完成开窗排序代码的开发,有如下要求:

1、构建输入测试数据 col1、col2、rank,rank是数字类型,col2是商家名称,col1是商家ID。

2、根据col1、col2 完成开窗排序代码的开发,rank为排序字段,请使用开窗函数row_number()降序排序,并输出排序结果。

体验总结:

优点:经过2~3次的描述语言修复,ChatGPT可以完成要求生成的Demo代码样例。

缺点:需要结构化语言的描述并且具有一定的研发背景,了解背后的技术实现。

B、Python设计模式推荐

1、推荐适合高并发场景的单例模式【完成任务】

2、对于扩展类的场景也给出了建议【进阶任务】

3、提供代码解释和代码样例【仅供参考】

 代码样例输出:

C、Python代码修复能力

语言输入:

代码bug修复需要提供报错信息和源代码一下python3代码报错:ZeroDivisionError: division by zero,请帮我修复并提供最新优化代码,代码如下:

m = 100for i in range(100):print("计算结果:", m/i)print("循环次数:", i+1)

缺点:针对代码块的优化,由于数据安全问题无法赋权给ChatGPT,所以具有局限性【包括解释代码】.

 

D、异常代码的检测

 总结:总体来说结果很中肯,基本是网上常见的问题诊断,具有一定的参考建议的。

E、测试数据内容生成

单表和多表测试数据

体验总结:

1、表达不是很清晰的话,需要告知多次GPT才能辅助你生成正确的测试数据。

2、不太适合大批量的数据生成,不如人工写规则生成,或者让GPT给写个规则逻辑。

3、测试的同事其实申请GPT作为辅助工具帮助生成测试数据。

多表关联测试数据生成:

 

F、数据分析能力

制表能力展现:【曲线图和气泡图】

曲线图:【ChatGPT提供Python代码】

数据样本:

气泡图:【ChatGPT提供Python代码】

数据样本:

G、报告生成展示

语言输入:

下述数据描述的是商家"兴隆电商"在2022年1月至2023年3月的配送费和实际跨区率,数据为月粒度的,请帮忙分析数据输出分析报告并给出优化方案,数据中提供了优化后的配送费:

分析结果:

初步给出了比较中肯的回复:

1、有量化的数据输出

2、从跨区率给出优化方案和总结

 继续追问:

上述报告存在问题:

1、配送费不是美元,是人民币

2、能否详细的说下优化物流网络方案

继续追问:

服务KA商家我们还需要从哪些方面降低商家跨区率,因为KA商家都已经在全国部署本地仓,请给出建议?

三、结语 

1、ChatGPT在技术或者基础管理上已基本胜任,但是从创造力、想象力、解决方案制定表现不是很出色。

2、ChatGPT只是新工具时代的变革,它能够帮助很多人从繁琐耗时的工作中脱离出来,将时间献给更有价值的事情。

因此,研发和ChatGPT关系应该是互助的关系,一旦被定位为竞争关系就会很被动,研发更需要关注的是ChatGPT无法完成的方面:创新能力、分析能力、协作能力、解决方案规划能力 等。

 

 


http://www.ppmy.cn/news/968377.html

相关文章

用32行代码做了个简单的命令行版chatgpt

受公司脚本大神的启发,我今天也自己用32行代码做了个简单的命令行版chatgpt。 虽然网页版很好用,但这两天不知道为什么我的登录都被禁用了,好在api_key的curl方式还能用。 功能和大神们的当然没法比,不过好在简单,我…

chatgpt赋能powershell

最近chatgpt非常火爆,获得超高曝光度的同时,也让大家对ai和ai工具有了新的认识。关于chatgpt,可以参考这篇文章。 今天主要推荐一个可以与powershell集成的ai工具,其后端也是openai的服务,可以有效提高工作效率。 Po…

[chatGPT]问题分析示例一,mtu太小ip6地址加不进去

根据这两个条件,去查询chatGPT,发现可以找到对应的代码片段。看着chatGPT,已经将Linux代码整合过来了。很强大的一个功能。 Human: if mtu set to 64, why add ipv6 failure? AI: If the MTU is set to 64, it can cause IPv6 fragmentation failures. This is because IPv…

14.Java8日期时间工具类

提供了3种日期时间工具类,任选一种 目录 第一种 第二种 第三种 第一种 import java.text.ParseException; import java.text.SimpleDateFormat; import java.time.LocalDate; import java.time.LocalDateTime; import java.time.Period; import java.time.ZoneId; import…

目标检测算法——将xml格式转换为YOLOv5格式txt

深度学习Tricks,第一时间送达 XML:即可扩展标记语言,XML全称是Extensible Markup Language,中文译为可扩展的标记语言,它是SGML(标准通用标记语言)的一个子集,与hxml文件不同的是, X…

infer源码阅读之yolo.cu

目录 yolo.cu注意事项一、2023/3/30更新前言1.宏定义2.Norm3.后处理3.1 affine_project3.2 decode3.2.1 decode_common3.2.2 decode_v8 3.3 nms3.4 invoker 4.预处理5.decode_mask6.AffineMatrix7.InferImpl7.1 adjust_memory7.2 preprocess7.3 load7.4 forwards 8.其它9.拓展之…

前端食堂技术周刊第 76 期:第 95 次 TC39 会议、React Labs 工作进展、加速 JavaScript 生态系统、设计系统元规范、AI 一周资讯、前端开发者的终局

美味值:🌟🌟🌟🌟🌟 口味:惠林顿牛排 食堂技术周刊仓库地址:https://github.com/Geekhyt/weekly 本期摘要 第 95 次 TC39 会议React Labs 工作进展AI 一周资讯加速 JavaScript 生…

微软宣布开源提速15倍的 DeepSpeed-Chat !是个人就能人手实现一个ChatGPT?

点击“开发者技术前线”,选择“星标” 让一部分开发者看到未来 作者 | 微软 DeepSpeed 开源项目组来源 | 开源社 #01 概述 近日来,ChatGPT 及类似模型引发了人工智能(AI)领域的一场风潮。这场风潮对数字世界产生了革命性影响。Cha…