每日最新頭條.有趣資訊

應對程式員面試,你必須知道的八大數據結構

大數據文摘出品

編譯:Hope、睡不著的iris、胡笳、雲舟

瑞士電腦科學家Niklaus Wirth在1976年寫了一本書,名為《算法+數據結構=編程》。

40多年後,這個等式仍被奉為真理。這就是為什麽在面試過程中,需要考察軟體工程師對數據結構的理解。

幾乎所有的問題都需要面試者對數據結構有深刻的理解。無論你是初入職場的新兵(剛從大學或者編程補習班畢業),還是擁有幾十年經驗的職場老鳥。

有些面試題會明確提及某種數據結構,例如,“給定一個二叉樹。”而另一些則隱含在面試題中,例如,“我們希望記錄每個作者相關的書籍數量。”

即便是對於一些非常基礎的工作來說,學習數據結構也是必須的。那麽,就讓我們先從一些基本概念開始入手。

什麽是數據結構?

簡單地說,數據結構是以某種特定的布局方式存儲數據的容器。這種“布局方式”決定了數據結構對於某些操作是高效的,而對於其他操作則是低效的。首先我們需要理解各種數據結構,才能在處理實際問題時選取最合適的數據結構。

為什麽我們需要數據結構?

數據是電腦科學當中最關鍵的實體,而數據結構則可以將數據以某種組織形式存儲,因此,數據結構的價值不言而喻。

無論你以何種方式解決何種問題,你都需要處理數據——無論是涉及員工薪水、股票價格、購物清單,還是只是簡單的電話簿問題。

數據需要根據不同的場景,按照特定的格式進行存儲。有很多數據結構能夠滿足以不同格式存儲數據的需求。

常見的數據結構

首先列出一些最常見的數據結構,我們將逐一說明:

陣列

隊列

鏈表

字典樹(這是一種高效的樹形結構,但值得單獨說明)

散列表(哈希表)

陣列

陣列是最簡單、也是使用最廣泛的數據結構。棧、隊列等其他數據結構均由陣列演變而來。下圖是一個包含元素(1,2,3和4)的簡單陣列,陣列長度為4。

每個數據元素都關聯一個正數值,我們稱之為索引,它表明陣列中每個元素所在的位置。大部分語言將初始索引定義為零。

以下是陣列的兩種類型:

一維陣列(如上所示)

多維陣列(陣列的陣列)

陣列的基本操作

Insert——在指定索引位置插入一個元素

Get——返回指定索引位置的元素

Delete——刪除指定索引位置的元素

Size——得到陣列所有元素的數量

面試中關於陣列的常見問題

尋找陣列中第二小的元素

找到陣列中第一個不重復出現的整數

合並兩個有序陣列

重新排列陣列中的正值和負值

著名的撤銷操作幾乎遍布任意一個應用。但你有沒有思考過它是如何工作的呢?這個問題的解決思路是按照將最後的狀態排列在先的順序,在記憶體中存儲歷史工作狀態(當然,它會受限於一定的數量)。這沒辦法用陣列實現。但有了棧,這就變得非常方便了。

可以把棧想象成一列垂直堆放的書。為了拿到中間的書,你需要移除放置在這上面的所有書。這就是LIFO(後進先出)的工作原理。

下圖是包含三個數據元素(1,2和3)的棧,其中頂部的3將被最先移除:

棧的基本操作

Push——在頂部插入一個元素

Pop——返回並移除棧頂元素

isEmpty——如果棧為空,則返回true

Top——返回頂部元素,但並不移除它

面試中關於棧的常見問題

使用棧計算後綴表達式

對棧的元素進行排序

判斷表達式是否括號平衡

隊列

與棧相似,隊列是另一種順序存儲元素的線性數據結構。棧與隊列的最大差別在於棧是LIFO(後進先出),而隊列是FIFO,即先進先出。

一個完美的隊列現實例子:售票亭排隊隊伍。如果有新人加入,他需要到隊尾去排隊,而非隊首——排在前面的人會先拿到票,然後離開隊伍。

下圖是包含四個元素(1,2,3和4)的隊列,其中在頂部的1將被最先移除:

移除先入隊的元素、插入新元素

隊列的基本操作

Enqueue() —— 在隊列尾部插入元素

Dequeue() ——移除隊列頭部的元素

isEmpty()——如果隊列為空,則返回true

Top() ——返回隊列的第一個元素

面試中關於隊列的常見問題

使用隊列表示棧

對隊列的前k個元素倒序

使用隊列生成從1到n的二進製數

鏈表

鏈表是另一個重要的線性數據結構,乍一看可能有點像陣列,但在記憶體分配、內部結構以及數據插入和刪除的基本操作方面均有所不同。

鏈表就像一個節點鏈,其中每個節點包含著數據和指向後續節點的指針。 鏈表還包含一個頭指針,它指向鏈表的第一個元素,但當列表為空時,它指向null或無具體內容。

鏈表一般用於實現檔案系統、哈希表和鄰接表。

這是鏈表內部結構的展示:

鏈表包括以下類型:

單鏈表(單向)

雙向鏈表(雙向)

鏈表的基本操作:

InsertAtEnd - 在鏈表的末尾插入指定元素

InsertAtHead - 在鏈接列表的開頭/頭部插入指定元素

Delete  - 從鏈接列表中刪除指定元素

DeleteAtHead - 刪除鏈接列表的第一個元素

Search  - 從鏈表中返回指定元素

isEmpty - 如果鏈表為空,則返回true

面試中關於鏈表的常見問題

反轉鏈表

檢測鏈表中的循環

返回鏈表倒數第N個節點

刪除鏈表中的重複項

圖是一組以網絡形式相互連接的節點。節點也稱為頂點。 一對節點(x,y)稱為邊(edge),表示頂點x連接到頂點y。邊可以包含權重/成本,顯示從頂點x到y所需的成本。

圖的類型

無向圖

有向圖

在程式語言中,圖可以用兩種形式表示:

鄰接矩陣

鄰接表

常見圖遍歷算法

廣度優先搜索

深度優先搜索

面試中關於圖的常見問題

實現廣度和深度優先搜索

檢查圖是否為樹

計算圖的邊數

找到兩個頂點之間的最短路徑

樹形結構是一種層級式的數據結構,由頂點(節點)和連接它們的邊組成。 樹類似於圖,但區分樹和圖的重要特徵是樹中不存在環路。

樹形結構被廣泛應用於人工智能和複雜算法,它可以提供解決問題的有效存儲機制。

這是一個簡單樹的示意圖,以及樹數據結構中使用的基本術語:

Root - 根節點

Parent - 父節點

Child - 子節點

Leaf - 葉子節點

Sibling - 兄弟節點

以下是樹形結構的主要類型:

N元樹

平衡樹

二叉樹

二叉搜索樹

AVL樹

紅黑樹

2-3樹

其中,二叉樹和二叉搜索樹是最常用的樹。

面試中關於樹結構的常見問題:

求二叉樹的高度

在二叉搜索樹中查找第k個最大值

查找與根節點距離k的節點

在二叉樹中查找給定節點的祖先節點

字典樹(Trie)

字典樹,也稱為“前綴樹”,是一種特殊的樹狀數據結構,對於解決字元串相關問題非常有效。它能夠提供快速檢索,主要用於搜索字典中的單詞,在搜索引擎中自動提供建議,甚至被用於IP的路由。

以下是在字典樹中存儲三個單詞“top”,“so”和“their”的例子:

這些單詞以頂部到底部的方式存儲,其中綠色節點“p”,“s”和“r”分別表示“top”,“thus”和“theirs”的底部。

面試中關於字典樹的常見問題

計算字典樹中的總單詞數

列印存儲在字典樹中的所有單詞

使用字典樹對陣列的元素進行排序

使用字典樹從字典中形成單詞

構建T9字典(字典樹+ DFS )

哈希表

哈希法(Hashing)是一個用於唯一標識對象並將每個對象存儲在一些預先計算的唯一索引(稱為“鍵(key)”)中的過程。因此,對象以鍵值對的形式存儲,這些鍵值對的集合被稱為“字典”。可以使用鍵搜索每個對象。基於哈希法有很多不同的數據結構,但最常用的數據結構是哈希表。

哈希表通常使用陣列實現。

散列數據結構的性能取決於以下三個因素:

哈希函數

哈希表的大小

碰撞處理方法

下圖為如何在陣列中映射哈希鍵值對的說明。該陣列的索引是通過哈希函數計算的。

面試中關於哈希結構的常見問題:

在陣列中查找對稱鍵值對

追蹤遍歷的完整路徑

查找陣列是否是另一個陣列的子集

檢查給定的陣列是否不相交

以上是在編程面試之前你應該知曉的八大數據結構。

相關報導:

https://medium.freecodecamp.org/the-top-data-structures-you-should-know-for-your-next-coding-interview-36af0831f5e3

【今日機器學習概念】

Have a Great Definition

Contributors

回復“志願者”加入我們

獲得更多的PTT最新消息
按讚加入粉絲團