每日最新頭條.有趣資訊

面試碰壁卻讓我看清數據科學行業現狀

新智元原創

編輯:鵬飛

【新智元導讀】開發者自述沒有被聘為數據科學家,所以鑽研出當前數據科學整個行業的真實現狀。他發現實際上高學歷非常重要,而計算機、工程學、數學和統計都是非常主流的學科。他認為與其專注於數據科學家所需要的技能,不如專注於實際上能做什麽。Kaggle大師有用,但沒那麽有用。

你知道數據科學家這個行業,最熱的話題是什麽嗎?如何快速的賺到熱錢

你可能剛剛聽說數據科學家這個職業,或者已經從事該行業多年。每當提及“數據科學”這個詞的時候,可能總會有一份榮耀在心裡面。畢竟這是一個聽起來就很高科技的職業,自我介紹的時候會有人投來羨慕的目光。

但數據科學家的競爭正在變得越來越激烈,而數據科學家心中的那份情懷似乎也在逐漸的淡化。取而代之的是焦慮在不斷的滋長,而我們卻無能為力。

一方面,越來越多的人想入行數據科學家,希望獲取名聲和利益;另一方面,企業在數據科學家這個崗位上開始有些搖擺,很多公司甚至錯誤的將數據標注等工作當做是數據科學家。

上述情況,並沒有隨著人工智能的發展而有所改善。最近。一位名叫Hanif Samad的新加坡的統計學家、軟體工程師、數據科學家在找工作的時候有些碰壁,讓他開始對數據科學整個行業的現狀進行反思。

他發現,在數據科學家最集中的平台Towards Data Science上,有關數據科學最熱的文章是《數據科學家如何跟股東相處》,其他的像《如何成為一名數據工程師》、《批量梯度下降與隨機梯度下降》、《多類文本分類》、《加速R-CNN》這類特別細分的技巧類文章非常熱門。

因為Samad只有一段短暫的數據科學經歷,在實際面試的過程中他才意識到,平時看到那些教導你如何成為數據科學家的成功學文章,以及那些技巧類文章,毫無用武之地。空有一身屠龍技,卻面臨無龍可屠的局面,典型的Daniel Kahneman口中“可用性啟發式的受害者”。

所以Samad開始鑽研一個問題:那些真正在從事數據科學的人,到底在做什麽?到底數據科學這個行業,真正的現狀是什麽?

作為一名統計學家和數據科學家,Samad通過爬取LinkedIn上的數據,對目前的數據科學行業進行了一次摸底。在分析了近1000個數據科學家檔案後,結果還真讓他發現了一些很少有人提及的內幕。

發現1:研究生學位是標配

73%目前就業的數據科學家擁有研究生學位。其中碩士學位較多佔44%;剩下博士學位29%,學士學位佔到了21%。除了全日製大學畢業外,也有部分數據科學家擁有的是MOOC學位或培訓班的函授學位,共佔總數的6%。

計算機科學與工程、以及業務分析是主流

計算機科學,數學和統計學以及工程學科魔幻三俠的共同概念構成了數據科學事業的基石,這在一定程度上得到了數據的證實。

目前看來,就學科而論,計算機科學勝過所有其他學科,擁有絕對的主導地位,佔所有研究學科的14%。

但如果把工程學統一看做是一個類別的話,因為其包括了化學,電氣和電子學,以及所謂的知識工程等不同學科,這些學科加起來,累計佔學科總數的22%。

平時我們都以為,數據科學需要很強的數學和統計學的功底。但實際上,把數學和統計學所有學科包括應用數學,數學物理學,統計學和應用概率都算上,也隻佔研究學科的12%左右。

但最讓人驚訝的其實是業務分析和其他分析學科,總體佔了15%,比數學和統計學都高!

其他排名靠前的領域包括物理學(3.5%)和信息技術(2.2%)。

招聘數據科學家傾向於有一定經驗

雖然很多應屆畢業生確實也在競爭數據科學家的崗位,然而樣本中數據科學家填寫的工作經驗大多是4-6年。

大多數數據科學家的崗位都是新設置的

76%的數據科學家入行不足兩年,而其中42%工作經驗不足一年。這表明雖然大多數數據科學的職位空缺都是相對較新的,但是填補空缺的人已經在就業市場上待了一段時間。

一半的數據科學家角色來自非技術公司

雖然資金充足,成熟的技術公司(如谷歌或亞馬遜)傾向於成為數據科學家聘用的理想場所,但值得注意的是,該樣本中近一半(49%)的數據科學家來自非技術公司:金融和保險(11%),谘詢(9%),政府(5%),製造業(5%)和學術界(2.4%)的公司和機構。

在技術類別中,具有良好代表性的行業包括運輸(8%),企業(8%,包括IBM,SAP和Microsoft),電子商務(5%) 和財務(5%)。

有一大類技術公司作者將其標記為AI&ML(6.5%),包括DataRobot等公司,以及Amaris.AI等新產品。

結論

以上,有沒有打破你之前對數據科學家這個行業的印象呢?我們可以看到,數據科學家對學位的要求較高,學科方面則是計算機科學,工程,數學或分析專業更吃香。最好是已經有4-6年工作經驗的雇員。

值得注意的是,雖然我們看到有6%的人來自MOOC和培訓機構等非傳統認證的機構,但顯然擁有研究生學位才是最保險的。

數據科學正在快速發展,許多最重要的算法和技術將不被傳統的學術課程所涵蓋。所以除了學位,你還需要一些職業技能之外的能力。

最後,不要被焦慮蒙蔽了雙眼。你可能並不需要學習那麽多的數據科學技巧,但你應該好好想想,你做這件事情的目的是什麽?想要得到的是什麽?

獲得更多的PTT最新消息
按讚加入粉絲團