新智元報導
來源:Github
作者:Smilexuhc等
編輯:大明
【新智元導讀】想做數據科學家嗎?來看看前人大神走過的路吧!本文是來自Github的國內外數據競賽中Top解決方案總結貼,涵蓋NLP、電腦視覺等領域,乾貨滿滿喲。
隨著AI技術的日新月異,對AI人才的需求也水漲船高,AI技術構建離不開大量的數據。如何處理和利用這些數據,這個艱巨任務就落在了數據科學家的肩上。現在甚至有一種說法,稱數據科學家是21世紀最性感的工作。
儘管市場需求火爆,但並不是每個人都能成為一名合格的數據科學家。目前各大企業為了網羅數據科學的優秀人才,經常舉辦形式多樣的數據競賽。在競賽中常有令人眼前一亮的方案脫穎而出,也為後來人提供了寶貴經驗。
近日在Github上出現了一份乾貨資源總結貼,匯總了各大數據競賽中名列前茅的一些優選解決方案。如果你有志進軍AI行業,但對成為數據科學家還有些“心有余而力不足”,相信多看看前人大神的解決方案一定會有所裨益。
首先感謝這個總結貼的作者Smilexuhc(Github主頁:https://github.com/Smilexuhc),為我們提供了如此全面和精彩的技術乾貨,目前此貼中的資源還在不斷更新中,歡迎各位小夥伴們一起添磚加瓦!
下面就一起來看看這個帖子都分享了哪些精彩內容:
數據競賽資訊內容整理
數據競賽資訊:
https://github.com/iphysresearch/DataSciComp
ApacheCN 的kaggle資料鏈接:
https://github.com/apachecn/kaggle
Kaggle top方案整理:
https://github.com/EliotAndres/kaggle-past-solutions
純數據競賽Top解決方案整理
1、2018科大訊飛AI行銷算法大賽
Rank1:https://zhuanlan.zhihu.com/p/47807544
2、2018 IJCAI 阿里媽媽搜索廣告轉化預測
Rank1:https://github.com/plantsgo/ijcai-2018
Rank2:https://github.com/YouChouNoBB/ijcai-18-top2-single-mole-solution
Rank3: https://github.com/luoda888/2018-IJCAI-top3
Rank8: https://github.com/fanfanda/ijcai_2018
Rank8: https://github.com/Gene20/IJCAI-18
Rank9(第一賽季)https://github.com/yuxiaowww/IJCAI-18-TIANCHI
Rank29: https://github.com/bettenW/IJCAI18_Tianchi_Rank29
Rank41: https://github.com/cmlaughing/IJCAI-18
Rank48: https://github.com/YunaQiu/IJCAI-18alimama
Rank53: https://github.com/altmanWang/IJCAI-18-CVR
Rank60: https://github.com/Chenyaorui/ijcai_2018
Rank81: https://github.com/wzp123456/IJCAI_18
Rank94: https://github.com/Yangtze121/-IJCAI-18-
3、2018騰訊廣告算法大賽
Rank3: https://github.com/DiligentPanda/Tencent_Ads_Algo_2018
Rank6: https://github.com/nzc/tencent-contest
Rank7: https://github.com/guoday/Tencent2018_Lookalike_Rank7th
Rank9: https://github.com/ouwenjie03/tencent-ad-game
Rank10: https://github.com/keyunluo/Tencent2018_Lookalike_Rank10th
Rank10(初賽): https://github.com/ShawnyXiao/2018-Tencent-Lookalike
Rank11:https://github.com/liupengsay/2018-Tencent-social-advertising-algorithm-contest
https://my.oschina.net/xtzggbmkk/blog/1865680
Rank26: https://github.com/zsyandjyhouse/TencentAD_contest
Rank33: https://github.com/John-Yao/Tencent_Social_Ads2018
4、2018高校大數據挑戰賽-快手活躍用戶預測
Rank1: https://github.com/drop-out/RNN-Active-User-Forecast
https://zhuanlan.zhihu.com/p/42622063
Rank4: https://github.com/chantcalf/2018-Rank4-
Rank13 (初賽 A榜rank2 B榜rank5): https://github.com/luoda888/2018-KUAISHOU-TSINGHUA-Top13-Solutions
Rank15: https://github.com/sunwantong/Kuaishou-Active-User
Rank20: https://github.com/bigzhao/Kuaishou_2018_rank20th
Rank28 (初賽A榜rank1,B榜rank2):https://github.com/YangKing0834131/2018-KUAISHOU-TSINGHUA-Top28-Solutions-
https://github.com/FNo0/2018-KUAISHOU-Top28
5、2018JDATA 用戶購買時間預測
Rank9:https://zhuanlan.zhihu.com/p/45141799
6、2018 DF風機葉片開裂預警
Rank2:https://github.com/SY575/DF-Early-warning-of-the-wind-power-system
7、2018 DF光伏發電量預測
Rank1:https://zhuanlan.zhihu.com/p/44755488?utm_source=qq&utm_medium=social&utm_oi=623925402599559168
https://mp.weixin.qq.com/s/Yix0xVp2SiqaAcuS6Q049g
8、AI全球挑戰者大賽-違約用戶風險預測
Rank1:https://github.com/chenkkkk/User-loan-risk-prediction
9、2016融360-用戶貸款風險預測
Rank7:https://github.com/hczheng/Rong360
10、2016 CCF-020優惠券使用預測
Rank1: https://github.com/wepe/O2O-Coupon-Usage-Forecast
11、2016 ccf-農產品價格預測
Rank2: https://github.com/xing89qs/CCF_Product
Rank35: https://github.com/wqlin/ccf-price-prediction
12、2016 ccf-客戶用電異常
Rank4: https://github.com/AbnerYang/2016CCF-StateGrid
13、2016 ccf-搜狗的用戶畫像比賽
Rank1: https://github.com/hengchao0248/ccf2016_sougou
Rank3: https://github.com/AbnerYang/2016CCF-SouGou
Rank5: https://github.com/dhdsjy/2016_CCFsougou
https://github.com/dhdsjy/2016_CCFsougou2
https://github.com/prozhuchen/2016CCF-sougou
https://github.com/coderSkyChen/2016CCF_BDCI_Sougou
14、2016 ccf-聯通的用戶軌跡
RankX: https://github.com/xuguanggen/2016CCF-unicom
15、2016 ccf-Human or Robots
Rank6: https://github.com/pickou/ccf_human_or_robot
16、菜鳥-需求預測與分倉規劃
Rank6: https://github.com/wepe/CaiNiao-DemandForecast-StoragePlaning
Rank10: https://github.com/xing89qs/TianChi_CaiNiao_Season2
自然語言處理類(NLP)
1、2018 DC達觀-文本智能處理挑戰
Rank1:https://github.com/ShawnyXiao/2018-DC-DataGrand-TextIntelProcess
Rank4: https://github.com/hecongqing/2018-daguan-competition
Rank10: https://github.com/moneyDboat/data_grand
Rank18: https://github.com/nlpjoe/daguan-classify-2018
Rank X: https://github.com/yanqiangmiffy/daguan
2、智能客服問題相似度算法設計——第三屆魔鏡杯大賽
Rank6:https://github.com/qrfaction/paipaidai
Rank16:https://github.com/guoday/PaiPaiDai2018_rank16
Rank29: https://github.com/wangjiaxin24/daguan_NLP
3、2018 JD Dialog Challenge 任務導向型對話系統挑戰賽
Rank3: https://github.com/zengbin93/jddc_solution_4th
4、2018CIKM AnalytiCup – 阿里小蜜機器人跨語言短文本匹配算法競賽
Rank2: https://github.com/zake7749/Closer
Rank12:https://github.com/Leputa/CIKM-AnalytiCup-2018
Rank18: https://github.com/VincentChen525/Tianchi/tree/master/CIKM%20AnalytiCup%202018
電腦視覺類(CV)
Kaggle-TGS
Rank56 :https://github.com/Gary-Deeplearning/TGS-Salt
一些經驗分享
介紹featexp 一個幫助理解特徵的工具包
http://www.sohu.com/a/273552971_129720
Ask Me Anything session with a Kaggle Grandmasterby Vladimir I. IglovikovPDF下載:https://pan.baidu.com/s/1XkFwko_YrI5TfjjIai7ONQ
一些大佬的Github
PS:希望大家star,fork一下
特別感謝金老師對整理比賽開源已做出的貢獻,特別是在2016年的ccf大賽中。
分享團隊聯繫方式:
資源鏈接:
https://github.com/Smilexuhc/Data-Competition-TopSolution
【加入社群】
新智元 AI 技術 + 產業社群招募中,歡迎對 AI 技術 + 產業落地感興趣的同學,加小助手微信號:aiera2015_3入群;通過審核後我們將邀請進群,加入社群後務必修改群備注(姓名 - 公司 - 職位;專業群審核較嚴,敬請諒解)。