Coggle 30 Days of ML(2023年7月)任务一:比赛报名及数据读取
任务一:报名比赛,下载比赛数据集并完成数据读取
- 说明:在这个任务中,我将访问比赛网站并完成比赛报名。然后会下载比赛的数据集,并使用Pandas库来读取和加载数据。
- 实践步骤:
- 访问比赛网站:https://challenge.xfyun.cn/topic/info?type=text-detector&ch=vWxQGFU。
- 完成比赛的报名,并获取数据集的下载链接。
- 使用下载链接来下载比赛的数据集。
- 最后使用Pandas库来读取和加载数据集,将数据转换为可以进行处理的数据结构。
比赛报名及下载数据集
首先,我会报名参加《ChatGPT生成文本检测器》比赛,然后我会下载相关的数据集。比赛数据集可以在赛题数据集中找到。
数据读取
接下来,使用Pandas库来读取数据:
import pandas as pdtrain_data = pd.read_csv('ChatGPT/train.csv')
test_data = pd.read_csv('ChatGPT/test.csv')
可以看到train_data
和test_data
包含了三个字段,分别是“name”,“label”和“content”。