首页 > 其他分享 >爱可可推荐!关于竞赛思路,方法和代码实践,Datawhale数据竞赛Baseline开源分享!

爱可可推荐!关于竞赛思路,方法和代码实践,Datawhale数据竞赛Baseline开源分享!

时间:2022-12-29 15:01:04浏览次数:66  
标签:竞赛 比赛 baseline 代码 赛题 Datawhale 分享 Baseline



数据竞赛中baseline是最入门的分享,

它不仅有思路、方法还有内容;

或许你与Top选手的差距就是一个baseline!



01

项目介绍


如果你是数据竞赛的初学者、爱好者,比赛的baseline不仅是比赛思路分享,同时也是一类数据问题的方法总结。我们想做的就是收集并整理并分享各种比赛的baseline方案。​


你可能会问为什么是baseline,而不是获胜者的代码分享?相比于获胜者的代码baseline代码都比较简单,容易整理和学习;其次baseline代码更加实用和简洁,适合入门学习。

爱可可推荐!关于竞赛思路,方法和代码实践,Datawhale数据竞赛Baseline开源分享!_数据

​https://www.kaggle.com/c/nfl-big-data-bowl-2020/​

在每个Kaggle比赛中baseline分享一般都是最受大家欢迎的,也是点赞最多的kernel。比赛的baseline不仅能降低参赛的门槛,同时也能极大程度刺激选手的参赛热情。

鉴于国内比赛平台没有类似的分享机制,于是我们(阿水和鱼佬)在Datawhale计划做一个国内的竞赛baseline分享计划,我们目标是做成国内最完整的竞赛baseline和比赛案例分享项目。

我们的baseline开源项目初步构建完成:

​https://github.com/datawhalechina/competition-baseline​

02

项目内容

我们对国内外常见的数据竞赛平台进行整理:


国外竞赛平台:

  • Kaggle
  • DrivenData
  • Colalab
  • CrowdAI
  • Kelvins
  • Signate
  • analyticsvidhya

国内竞赛平台:

  • 天池
  • 点石
  • JData
  • DataCastle
  • DataFountain
  • Biendata
  • 科赛
  • AI研习社
  • 图灵联邦
  • AI Studio
  • FlyAI

我们还对国内比赛的baseline进行了全面的整理。为了帮助大家更好的学习,我们根据赛题的数据类型分为三类典型比赛:

  • 结构化数据比赛:表格形式的赛题;
  • 计算机视觉(CV)比赛:图像类型的赛题;
  • 自然语言处理(NLP)比赛:文本类型的赛题;

结构化数据比赛:

  • 白葡萄酒品质预测
  • 肌肉活动电信号推测手势
  • 肌肉活动电信号推测手势
  • Retention Rate of Baidu Hao Kan APP Users
  • kaggle-two-sigma-connect-rental-listing-inquiries
  • kaggle-allstate-claims-severity

爱可可推荐!关于竞赛思路,方法和代码实践,Datawhale数据竞赛Baseline开源分享!_数据_02

爱可可推荐!关于竞赛思路,方法和代码实践,Datawhale数据竞赛Baseline开源分享!_数据_03

爱可可推荐!关于竞赛思路,方法和代码实践,Datawhale数据竞赛Baseline开源分享!_自然语言处理_04

爱可可推荐!关于竞赛思路,方法和代码实践,Datawhale数据竞赛Baseline开源分享!_自然语言处理_05

爱可可推荐!关于竞赛思路,方法和代码实践,Datawhale数据竞赛Baseline开源分享!_自然语言处理_06


计算机视觉CV比赛:

  • 胸腔X光肺炎检测
  • CCF2019-视频版权检测算法
  • kaggle-quickdraw-doodle-recognition
  • TinyMind人民币面值&冠字号编码识别挑战赛

爱可可推荐!关于竞赛思路,方法和代码实践,Datawhale数据竞赛Baseline开源分享!_数据_07

爱可可推荐!关于竞赛思路,方法和代码实践,Datawhale数据竞赛Baseline开源分享!_数据_08

爱可可推荐!关于竞赛思路,方法和代码实践,Datawhale数据竞赛Baseline开源分享!_自然语言处理_09


自然语言处理NLP比赛:

  • 智源&计算所-互联网虚假新闻检测挑战赛
  • 互联网金融新实体发现
  • 技术需求与技术成果项目之间关联度计算模型
  • 互联网新闻情感分析
  • 第三届阿里云安全算法挑战赛

爱可可推荐!关于竞赛思路,方法和代码实践,Datawhale数据竞赛Baseline开源分享!_计算机视觉_10

爱可可推荐!关于竞赛思路,方法和代码实践,Datawhale数据竞赛Baseline开源分享!_数据_11

爱可可推荐!关于竞赛思路,方法和代码实践,Datawhale数据竞赛Baseline开源分享!_自然语言处理_12

爱可可推荐!关于竞赛思路,方法和代码实践,Datawhale数据竞赛Baseline开源分享!_计算机视觉_13

爱可可推荐!关于竞赛思路,方法和代码实践,Datawhale数据竞赛Baseline开源分享!_自然语言处理_14

03

项目协作

一个优秀的开源项目少不了大家的协作,我们也希望大家踊跃参与到项目的分享过程中,让baseline帮助更多的人学习和成长。

为了让大家更加合理有序的贡献,我们初步制定了以下的协作机制:

  1. 代码按照比赛的形式整理,写明比赛网址、数据类型和解题赛题;
  2. 代码注明运行的环境,机器最低配置,如:
  • 操作系统:Linux,内存16G,
  • Python环境:Python2/3
  • Pytorch版本:0.4.0
  • baseline代码只能提供可运行的代码和思路,请不要提供直接可以提交的结果文件;
  • 代码提供者应对代码版权和共享权负责;

Datawhale竞赛群已成立


标签:竞赛,比赛,baseline,代码,赛题,Datawhale,分享,Baseline
From: https://blog.51cto.com/u_15699042/5977622

相关文章

  • kaggle竞赛_mnist_10%
     主要是通过mnist了解kaggle的操作细节,最终这里的结果为:引入必须的库​​¶​​importpandasaspdimportnumpyasnpimportmatplotlib.pyplotasp......
  • 广东工业大学文远知行杯新生程序设计竞赛(重现赛)
    A.迫真算法部・ACの裏技(Nowcoder49259A)题目大意给定键盘输入顺序,问是否按了CTRLC后按了CTRLV。解题思路模拟即可。神奇的代码#include<bits/stdc++.h>usi......
  • 关于信息学竞赛的赛制问题
    写这篇随笔只是希望选手能对赛制有更多了解别因为对赛制不熟犯了奇怪的错误是否有队友和您要参加的比赛有关,不一定和赛制有关排名规则一般为得分/AC题目数+罚时一般......
  • Datawhale组队学习——大话设计模式Task02学习笔记
    Task02:策略、装饰、代理个人抽象理解:策略:灵活多变的算法实现规则装饰:把类的核心职责和装饰功能区分开了,去除相关类中重复的装饰逻辑;把类中的装饰功能从类中搬移去除,简......
  • 激光炸弹【算法竞赛进阶指南, HNOI2003】
    激光炸弹地图上有\(N\)个目标,用整数\(Xi,Yi\)表示目标在地图上的位置,每个目标都有一个价值\(Wi\)。注意:不同目标可能在同一位置。现在有一种新型的激光炸弹,可以摧毁......
  • Datawhale数据分析教程来了!
    贡献者:陈安东、金娟娟、杨佳达、老表开源初心当我入门数据分析时,用的是鼎鼎大名的《pythonfordataanalysis》,书中对技术操作讲解细致,但遗憾的是,对于数据分析的逻辑介绍就......
  • Datawhale团队第三期录取名单!
     Datawhale团队 公示:Datawhale组织成员Datawhale已经成立一年半了,从一开始的12个人,学习互助,到提议建立开源组织,做更多开源的事情,帮助更多学习者,也促进我们更好地成长。于......
  • Datawhale组队学习——大话设计模式Task01学习笔记
    闲言碎语有次和学长闲聊提到了设计模式,也推荐了一个B站的视频。然后也一直忙别的事情始终没有好好学习一下。恰逢学期末有时间,datawhale又出了这门新教程,便一起学习下,看看......
  • 【补题】2022年中国大学生程序设计竞赛女生专场
    比赛链接2022年中国大学生程序设计竞赛女生专场A.减肥计划签到题暴力模拟,如果模拟到最重的人到队首还没有人连续获胜\(k\)轮,那么答案显然就是最重的人。方便起见可以......
  • 入门cv必读的10篇baseline论文
    我把CV文本分类任务的10篇经典论文称为“baseline论文”——基石论文。吃透baseline论文,是学习CV其他细分任务论文的基础。这10篇论文的篇目如下:NIPS-2012,Alexnet:深度学习C......