kaggle竞赛(初识)

server/2025/3/5 6:11:25/

PART 0 : Kaggle 介绍

        Kaggle是什么?

答案很简单Kaggle是数据挖掘比赛火起来的,以至于中国兴起了很多很多类似的比赛;Kaggle 是一个数据科学竞赛的平台,很多公司会发布一些接近真实业务的问题,吸引爱好数据科学的人来一起解决。

Kaggle提供了一个介于“完美”与真实之间的过渡,问题的定义基本良好,却夹着或多或少的难点,一般没有完全成熟的解决方案。在参赛过程中与论坛上的其他参赛者互动,能不断地获得启发,受益良多。即使对于一些学有所成的高手乃至大牛,参加Kaggle也常常会获得很多启发,与来着世界各地的队伍进行厮杀的刺激更让人欲罢不能。更重要的是,Kaggle是业界普遍承认的竞赛平台,能从Kaggle上的一些高质量竞赛获取好名次,是对自己实力极好的证明,还能给自己的履历添上光辉的一笔。如果能获得金牌,杀入奖金池,那更是名利兼收,再好不过。

Kaggle适用于以下人群:

  • 我是小白,但是对数据科学充满求知欲。
  • 我想要历练自己的数据挖掘和机器学习技能,成为一名真正的数据科(lao)学(si)家(ji)。
  • 我想赢取奖金,成为人生赢家

如果你从未独立做过一个项目,还是要从练习赛开始熟悉。因为竞赛模式中的任务是公司悬赏发布的实际案例,并没有标准的答案;而练习赛不仅项目难度低,而且是有官方给出的参考方案的,大家可以用来对比改善自己的测试结果,从中进行提高。所以呢,建议感兴趣的同学先去独立做一下101和playground的训练赛,至于做多少个案例才能上道,就要看个人素质啦。这里为大家推荐几篇非常好的文章,里面手把手的教了大家入门级的三个经典练习项目,供大家学习。

1. Titanic(泰坦尼克之灾)
中文教程: 逻辑回归应用之Kaggle泰坦尼克之灾
英文教程:An Interactive Data Science Tutorial

2. House Prices: Advanced Regression Techniques(房价预测)
中文教程:Kaggle竞赛 — 2017年房价预测
英文教程:How to get to TOP 25% with Simple Model using sklearn

3. Digital Recognition(数字识别)
中文教程:大数据竞赛平台—Kaggle 入门
英文教程:Interactive Intro to Dimensionality Reduction

参加 kaggle 最简单的流程就是:

  • 第一步:在 Data 里面下载三个数据集,最基本的就是上面提到的三个文件,有些比赛会有附加的数据描述文件等。
  • 第二步:自己在线下分析,建模,调参,把用 test 数据集预测好的结果,按照 sample_submission 的格式输出到 csv 文件中。
  • 第三步:点击蓝色按钮 ’Submit Predictions’ ,把 csv 文件拖拽进去,然后系统就会加载并检验结果,稍等片刻后就会在 Leaderboard 上显示当前结果所在的排名位置。

以上都不是我说的【关于做Kaggle比赛入门,看完这篇就够了-CSDN博客,别骂昂】地址在这里!!!

【写这个的主要目的呢,是想和大家一起学习然后共同进步,现在是大学生一枚,希望找到志同道合的朋友,要是有人感兴趣可以组个QQ群,我先学去喽】


http://www.ppmy.cn/server/172527.html

相关文章

5. 快速排序

快速排序是Hoare于1962年提出的一种二叉树结构的交换排序方法,其基本思想为:任取待排序 元素序列中的某元素作为基准值,按照该排序码将待排序集合分割成两子序列,左子序列中所有 元素均小于基准值,右子序列中所有元素均…

Windows10系统构建本地安全私有化的个人知识库——采用DeepSeek+RAGFlow

一、为什么要构建本地私有化个人知识库 1.1、自身需求 1、需要相关隐私资料内容的安全保护可控; 2、需要根据自身的隐私资料内容构建出个性化的知识库; 一些常见的业务场景如:①希望我们的智能助手可以根据公司的管理制度回答问题,让员工可以随时了解公司相关制度内容信息;…

每天练打字17:连续两天赛文速度突破100,今日赛文速度83.01

今日跟打:1932字 总跟打:221584字 记录天数:2602天 (实际没有这么多天,这个是注册账号的天数) 平均每天:85字 今日赛文首打速度:83.01 上周定的目标是:练习常用字前500&…

sass语法@import将被放弃???升级@use食用指南!

相信各位同学最近使用sass时会遇到控制台警告问题,这是因为随着CSS发展,sass将升级导入文件的语法,import语法因为全局作用域,依赖关系混乱等原因将被use语法取代。 在 Sass 中,import 和 use 都用于模块化代码&#…

Qt之QGraphicsView图像操作

QGraphicsView图像操作:旋转、放大、缩小、移动、图层切换 1 摘要 GraphicsView框架结构主要包含三个主要的类QGraphicsScene(场景)、QGraphicsView(视图)、QGraphicsItem(图元)。QGraphicsScene本身不可见,是一个存储图元的容器,必须通过与之相连的QGraphicsView视图来显…

CC++链接数据库(MySQL)超级详细指南

C/C链接数据库(MySQL)超级详细指南 在C/C编程中,与数据库进行交互是一项常见的任务。MySQL作为一个广泛使用的开源关系型数据库管理系统,提供了丰富的API供C/C开发者使用。本文将详细介绍如何在C/C程序中链接MySQL数据库&#xf…

PMP项目管理—资源管理篇—3.获取资源

文章目录 基本信息4W1HITTO输入工具与技术输出 虚拟团队资源日历 基本信息 4W1H what: 获取项目所需的团队成员、设施、设备、材料、用品和其他资源的过程。why: 为开展项目工作,配备资源、组成团队。who: 项目所需资源可能来自项目执行组织的内部或外部。内部资源…

使用AI后为什么思考会变得困难?

使用AI后为什么思考会变得困难? 我总结了四篇近期的研究论文,来展示AI是如何以及为什么侵蚀我们的批判性思维能力。 作者使用AI制作的图像 前言:作者在这篇文章中,借AI技术的崛起,揭示了一场悄然发生的思想博弈。表面…