每日最新頭條.有趣資訊

全球數據競賽Top解決方案開源整理與匯總

新智元報導

來源:Github

作者:Smilexuhc等

編輯:大明

【新智元導讀】想做數據科學家嗎?來看看前人大神走過的路吧!本文是來自Github的國內外數據競賽中Top解決方案總結貼,涵蓋NLP、電腦視覺等領域,乾貨滿滿喲。

隨著AI技術的日新月異,對AI人才的需求也水漲船高,AI技術構建離不開大量的數據。如何處理和利用這些數據,這個艱巨任務就落在了數據科學家的肩上。現在甚至有一種說法,稱數據科學家是21世紀最性感的工作。

儘管市場需求火爆,但並不是每個人都能成為一名合格的數據科學家。目前各大企業為了網羅數據科學的優秀人才,經常舉辦形式多樣的數據競賽。在競賽中常有令人眼前一亮的方案脫穎而出,也為後來人提供了寶貴經驗。

近日在Github上出現了一份乾貨資源總結貼,匯總了各大數據競賽中名列前茅的一些優選解決方案。如果你有志進軍AI行業,但對成為數據科學家還有些“心有余而力不足”,相信多看看前人大神的解決方案一定會有所裨益。

首先感謝這個總結貼的作者Smilexuhc(Github主頁:https://github.com/Smilexuhc),為我們提供了如此全面和精彩的技術乾貨,目前此貼中的資源還在不斷更新中,歡迎各位小夥伴們一起添磚加瓦!

下面就一起來看看這個帖子都分享了哪些精彩內容:

數據競賽資訊內容整理

數據競賽資訊:

https://github.com/iphysresearch/DataSciComp

ApacheCN 的kaggle資料鏈接:

https://github.com/apachecn/kaggle

Kaggle top方案整理:

https://github.com/EliotAndres/kaggle-past-solutions

純數據競賽Top解決方案整理

1、2018科大訊飛AI行銷算法大賽

Rank1:https://zhuanlan.zhihu.com/p/47807544

2、2018 IJCAI 阿里媽媽搜索廣告轉化預測

Rank1:https://github.com/plantsgo/ijcai-2018

Rank2:https://github.com/YouChouNoBB/ijcai-18-top2-single-mole-solution

Rank3: https://github.com/luoda888/2018-IJCAI-top3

Rank8: https://github.com/fanfanda/ijcai_2018

Rank8: https://github.com/Gene20/IJCAI-18

Rank9(第一賽季)https://github.com/yuxiaowww/IJCAI-18-TIANCHI

Rank29: https://github.com/bettenW/IJCAI18_Tianchi_Rank29

Rank41: https://github.com/cmlaughing/IJCAI-18

Rank48: https://github.com/YunaQiu/IJCAI-18alimama

Rank53: https://github.com/altmanWang/IJCAI-18-CVR

Rank60: https://github.com/Chenyaorui/ijcai_2018

Rank81: https://github.com/wzp123456/IJCAI_18

Rank94: https://github.com/Yangtze121/-IJCAI-18-

3、2018騰訊廣告算法大賽

Rank3: https://github.com/DiligentPanda/Tencent_Ads_Algo_2018

Rank6: https://github.com/nzc/tencent-contest

Rank7: https://github.com/guoday/Tencent2018_Lookalike_Rank7th

Rank9: https://github.com/ouwenjie03/tencent-ad-game

Rank10: https://github.com/keyunluo/Tencent2018_Lookalike_Rank10th

Rank10(初賽): https://github.com/ShawnyXiao/2018-Tencent-Lookalike

Rank11:https://github.com/liupengsay/2018-Tencent-social-advertising-algorithm-contest

https://my.oschina.net/xtzggbmkk/blog/1865680

Rank26: https://github.com/zsyandjyhouse/TencentAD_contest

Rank33: https://github.com/John-Yao/Tencent_Social_Ads2018

4、2018高校大數據挑戰賽-快手活躍用戶預測

Rank1: https://github.com/drop-out/RNN-Active-User-Forecast

https://zhuanlan.zhihu.com/p/42622063

Rank4: https://github.com/chantcalf/2018-Rank4-

Rank13 (初賽 A榜rank2 B榜rank5): https://github.com/luoda888/2018-KUAISHOU-TSINGHUA-Top13-Solutions

Rank15: https://github.com/sunwantong/Kuaishou-Active-User

Rank20: https://github.com/bigzhao/Kuaishou_2018_rank20th

Rank28 (初賽A榜rank1,B榜rank2):https://github.com/YangKing0834131/2018-KUAISHOU-TSINGHUA-Top28-Solutions-

https://github.com/FNo0/2018-KUAISHOU-Top28

5、2018JDATA 用戶購買時間預測

Rank9:https://zhuanlan.zhihu.com/p/45141799

6、2018 DF風機葉片開裂預警

Rank2:https://github.com/SY575/DF-Early-warning-of-the-wind-power-system

7、2018 DF光伏發電量預測

Rank1:https://zhuanlan.zhihu.com/p/44755488?utm_source=qq&utm_medium=social&utm_oi=623925402599559168

https://mp.weixin.qq.com/s/Yix0xVp2SiqaAcuS6Q049g

8、AI全球挑戰者大賽-違約用戶風險預測

Rank1:https://github.com/chenkkkk/User-loan-risk-prediction

9、2016融360-用戶貸款風險預測

Rank7:https://github.com/hczheng/Rong360

10、2016 CCF-020優惠券使用預測

Rank1: https://github.com/wepe/O2O-Coupon-Usage-Forecast

11、2016 ccf-農產品價格預測

Rank2: https://github.com/xing89qs/CCF_Product

Rank35: https://github.com/wqlin/ccf-price-prediction

12、2016 ccf-客戶用電異常

Rank4: https://github.com/AbnerYang/2016CCF-StateGrid

13、2016 ccf-搜狗的用戶畫像比賽

Rank1: https://github.com/hengchao0248/ccf2016_sougou

Rank3: https://github.com/AbnerYang/2016CCF-SouGou

Rank5: https://github.com/dhdsjy/2016_CCFsougou

https://github.com/dhdsjy/2016_CCFsougou2

https://github.com/prozhuchen/2016CCF-sougou

https://github.com/coderSkyChen/2016CCF_BDCI_Sougou

14、2016 ccf-聯通的用戶軌跡

RankX: https://github.com/xuguanggen/2016CCF-unicom

15、2016 ccf-Human or Robots

Rank6: https://github.com/pickou/ccf_human_or_robot

16、菜鳥-需求預測與分倉規劃

Rank6: https://github.com/wepe/CaiNiao-DemandForecast-StoragePlaning

Rank10: https://github.com/xing89qs/TianChi_CaiNiao_Season2

自然語言處理類(NLP)

1、2018 DC達觀-文本智能處理挑戰

Rank1:https://github.com/ShawnyXiao/2018-DC-DataGrand-TextIntelProcess

Rank4: https://github.com/hecongqing/2018-daguan-competition

Rank10: https://github.com/moneyDboat/data_grand

Rank18: https://github.com/nlpjoe/daguan-classify-2018

Rank X: https://github.com/yanqiangmiffy/daguan

2、智能客服問題相似度算法設計——第三屆魔鏡杯大賽

Rank6:https://github.com/qrfaction/paipaidai

Rank16:https://github.com/guoday/PaiPaiDai2018_rank16

Rank29: https://github.com/wangjiaxin24/daguan_NLP

3、2018 JD Dialog Challenge 任務導向型對話系統挑戰賽

Rank3: https://github.com/zengbin93/jddc_solution_4th

4、2018CIKM AnalytiCup – 阿里小蜜機器人跨語言短文本匹配算法競賽

Rank2: https://github.com/zake7749/Closer

Rank12:https://github.com/Leputa/CIKM-AnalytiCup-2018

Rank18: https://github.com/VincentChen525/Tianchi/tree/master/CIKM%20AnalytiCup%202018

電腦視覺類(CV)

Kaggle-TGS

Rank56 :https://github.com/Gary-Deeplearning/TGS-Salt

一些經驗分享

介紹featexp 一個幫助理解特徵的工具包

http://www.sohu.com/a/273552971_129720

Ask Me Anything session with a Kaggle Grandmasterby Vladimir I. IglovikovPDF下載:https://pan.baidu.com/s/1XkFwko_YrI5TfjjIai7ONQ

一些大佬的Github

PS:希望大家star,fork一下

特別感謝金老師對整理比賽開源已做出的貢獻,特別是在2016年的ccf大賽中。

分享團隊聯繫方式:

資源鏈接:

https://github.com/Smilexuhc/Data-Competition-TopSolution

【加入社群】

新智元 AI 技術 + 產業社群招募中,歡迎對 AI 技術 + 產業落地感興趣的同學,加小助手微信號:aiera2015_3入群;通過審核後我們將邀請進群,加入社群後務必修改群備注(姓名 - 公司 - 職位;專業群審核較嚴,敬請諒解)。

獲得更多的PTT最新消息
按讚加入粉絲團