每日最新頭條.有趣資訊

大數據告訴你如何優雅入職谷歌!

作者 | SangYeon Choi

題圖 | 網絡

數據科學家(Data Scientist)被視為“21世紀最性感的工作”!不論在矽谷還是在中國,企業對於數據科學家的需求都很旺盛,那麽如何成為一位數據科學家呢?或者數據科學家都需要哪些技能呢?本文數據俠SangYeon Choi獲取了谷歌相關的招聘數據,並通過Shiny App可視化項目,為讀者揭曉如何成為一名谷歌的數據科學家。

▍為什麽要學習數據科學?

當然,你可以列出各種各樣的原因,但是最重要的原因是要找到數據科學家的工作。學生們學習了各種各樣的數據科學技能,並且將其與他們自己領域裡的技能相結合。一些值得注意的技能包括:

數據科學能力

面試技巧

社交人脈

找工作的機會

數據科學家是很有前途的工作,隨著企業對於大數據分析需求的增長,各個相關領域的需求也跟著增加。

(圖片說明:數據科學家工作需求趨勢 永久工vs.合約工)

所以,我們需要掌握哪些技能?我能進入哪些公司?

(圖片說明:數據科學家的用戶畫像)

上圖是一個對數據科學家的群體畫像。70%是男性,至少懂一門外語,碩士或者博士學位,大家在數據科學家崗位上的平均工作年限是2年,全部的工作年限大多是4年半,有2到4年的使用 R/Python 的工作經驗。

那麽是否雇主在招聘時候也看重這些背景呢?我決定拿Google的招聘數據作為案例,進行數據分析。

▍數據準備

這些數據來自Kaggle的現成數據庫,這些都是使用 Selenium包從Google官方招聘網站爬取的資訊。

(圖片說明:Kaggle上關於谷歌工作技能的數據集)

由於這裡只有7個數據維度,有些不夠,所有我提煉了新的維度。我使用了簡單的文字匹配方法。

▍Shiny App可視化展示

最後,我根據獲取的數據設計了一個Shiny App的可視化展示。首先展示的是一個職位地圖。

我把這些職位資訊進行可視化,呈現在一個簡單的地圖上。作為一家全球公司,Google在全世界不同城市都有招聘。然而,可以看出,大部分還是集中在美國。

▍技能領域

以上的數據可視化是關於工作年限、語言以及整個雇傭狀況的資訊的頁面。整體來看,可以看到對於java的需求最高,C語言、Python、Javascrip和SQL分別排名1-5位。

在我們研究的數據科學家崗位方面,我們可以看到對於工作年限一般的人,matlab/Python能力的需求比較高。

另外,教育水準方面,大學生是最常見的。這說明在數據科學領域,實戰經驗和學科知識是最重要的。

▍招聘要求的詞雲

如果你仔細看這組從招聘資訊裡列出的最低要求資訊中提取出的詞雲,你可以發現很多有趣的點。

職位最低要求強調相關的工作經驗,而列在那些“更傾向於招聘”的資訊後的,則更多是諸如溝通能力等軟實力。這可以理解為作為一個團隊的一員所需要的不只是簡單的工作經歷。

更多細節可以查看我的R Shiny與Github上的數據與代碼。

R Shiny : https://hellotheresy.shinyapps.io/way_to_googler/

Github : https://github.com/hellotherecsy/way_to_google

我只是簡單地使用R Shiny進行了數據的可視化,如果我也用NLP(自然語言處理)處理一下相關文檔,會有更好的結果。

注:本文編譯自紐約數據科學院文章How to become a googler?點擊“閱讀原文”查看。內容僅為作者觀點,不代表DT數據俠立場。文中圖片部分來自作者。

期待更多數據俠乾貨分享、話題討論、福利發放?在公眾號DT數據俠(ID:DTdatahero)後台回復“數據社群”,可申請加入DT數據社群。

▍關於DT×NYCDSA

DT×NYCDSA是DT財經與紐約數據科學學院合作專欄。紐約數據科學學院(NYC Data Science Academy)是由一批活躍在全球的數據科學、大數據專家和SupStat Inc. 的成員共同組建的教育集團。

▍數據俠門派

本文數據俠SangYeon Choi,是一名大數據工程師,曾就職於韓國SK控股集團。畢業於韓國東國大學,並在紐約數據科學學院學習。

▍加入數據俠

數據俠計劃是由第一財經旗下DT財經發起的數據社群,包含數據俠專欄、數據俠實驗室系列活動和數據俠聯盟,旨在聚集大數據領域精英,共同挖掘數據價值。申請入群請添加DT君微信(dtcaijing003)並備注“數據社群”,合作請聯繫[email protected]

獲得更多的PTT最新消息
按讚加入粉絲團