快速介紹8種常用數(shù)據(jù)結(jié)構(gòu)
數(shù)據(jù)結(jié)構(gòu)是一種特殊的組織和存儲(chǔ)數(shù)據(jù)的方式,可以使我們可以更高效地對存儲(chǔ)的數(shù)據(jù)執(zhí)行操作。數(shù)據(jù)結(jié)構(gòu)在計(jì)算機(jī)科學(xué)和軟件工程領(lǐng)域具有廣泛而多樣的用途。
幾乎所有已開發(fā)的程序或軟件系統(tǒng)都使用數(shù)據(jù)結(jié)構(gòu)。此外,數(shù)據(jù)結(jié)構(gòu)屬于計(jì)算機(jī)科學(xué)和軟件工程的基礎(chǔ)。當(dāng)涉及軟件工程面試問題時(shí),這是一個(gè)關(guān)鍵主題。因此,作為開發(fā)人員,我們必須對數(shù)據(jù)結(jié)構(gòu)有充分的了解。
在本文中,我將簡要解釋每個(gè)程序員必須知道的幾種常用數(shù)據(jù)結(jié)構(gòu)。
數(shù)組是固定大小的結(jié)構(gòu),可以容納相同數(shù)據(jù)類型的項(xiàng)目。它可以是整數(shù)數(shù)組,浮點(diǎn)數(shù)數(shù)組,字符串?dāng)?shù)組或什至是數(shù)組數(shù)組(例如二維數(shù)組)。數(shù)組已建立索引,這意味著可以進(jìn)行隨機(jī)訪問。
Fig 1. Visualization of basic Terminology of Arrays
· 遍歷:遍歷所有元素并進(jìn)行打印。
· 插入:將一個(gè)或多個(gè)元素插入數(shù)組。
· 刪除:從數(shù)組中刪除元素
· 搜索:在數(shù)組中搜索元素。您可以按元素的值或索引搜索元素
· 更新:在給定索引處更新現(xiàn)有元素的值
· 用作構(gòu)建其他數(shù)據(jù)結(jié)構(gòu)的基礎(chǔ),例如數(shù)組列表,堆,哈希表,向量和矩陣。
· 用于不同的排序算法,例如插入排序,快速排序,冒泡排序和合并排序。
鏈表是一種順序結(jié)構(gòu),由相互鏈接的線性順序項(xiàng)目序列組成。因此,您必須順序訪問數(shù)據(jù),并且無法進(jìn)行隨機(jī)訪問。鏈接列表提供了動(dòng)態(tài)集的簡單靈活的表示形式。
讓我們考慮以下有關(guān)鏈表的術(shù)語。您可以通過參考圖2來獲得一個(gè)清晰的主意。
· 鏈表中的元素稱為節(jié)點(diǎn)。
· 每個(gè)節(jié)點(diǎn)都包含一個(gè)密鑰和一個(gè)指向其后繼節(jié)點(diǎn)(稱為next)的指針。
· 名為head的屬性指向鏈接列表的第一個(gè)元素。
· 鏈表的最后一個(gè)元素稱為尾。
Fig 2. Visualization of basic Terminology of Linked Lists
以下是可用的各種類型的鏈表。
· 單鏈列表—只能沿正向遍歷項(xiàng)目。
· 雙鏈表-可以在前進(jìn)和后退方向上遍歷項(xiàng)目。節(jié)點(diǎn)由一個(gè)稱為上一個(gè)的附加指針組成,指向上一個(gè)節(jié)點(diǎn)。
· 循環(huán)鏈接列表—鏈接列表,其中頭的上一個(gè)指針指向尾部,尾號的下一個(gè)指針指向頭。
· 搜索:通過簡單的線性搜索在給定的鏈表中找到鍵為k的第一個(gè)元素,并返回指向該元素的指針
· 插入:在鏈接列表中插入一個(gè)密鑰。插入可以通過3種不同的方式完成;在列表的開頭插入,在列表的末尾插入,然后在列表的中間插入。
· 刪除:從給定的鏈表中刪除元素x。您不能單步刪除節(jié)點(diǎn)。刪除可以通過3種不同方式完成;從列表的開頭刪除,從列表的末尾刪除,然后從列表的中間刪除。
· 用于編譯器設(shè)計(jì)中的符號表管理。
· 用于在使用Alt Tab(使用循環(huán)鏈表實(shí)現(xiàn))的程序之間進(jìn)行切換。
堆棧是一種LIFO(后進(jìn)先出-最后放置的元素可以首先訪問)結(jié)構(gòu),該結(jié)構(gòu)通常在許多編程語言中都可以找到。該結(jié)構(gòu)被稱為"堆棧",因?yàn)樗愃朴谡鎸?shí)世界的堆棧-板的堆棧。
Image Source: pixabay
下面給出了可以在堆棧上執(zhí)行的2個(gè)基本操作。請參考圖3,以更好地了解堆棧操作。
· Push 推送:在堆棧頂部插入一個(gè)元素。
· Pop 彈出:刪除最上面的元素并返回。
Fig 3. Visualization of basic Operations of Stacks
此外,為堆棧提供了以下附加功能,以檢查其狀態(tài)。
· Peep 窺視:返回堆棧的頂部元素而不刪除它。
· isEmpty:檢查堆棧是否為空。
· isFull:檢查堆棧是否已滿。
· 用于表達(dá)式評估(例如:用于解析和評估數(shù)學(xué)表達(dá)式的調(diào)車場算法)。
· 用于在遞歸編程中實(shí)現(xiàn)函數(shù)調(diào)用。
隊(duì)列是一種FIFO(先進(jìn)先出-首先放置的元素可以首先訪問)結(jié)構(gòu),該結(jié)構(gòu)通常在許多編程語言中都可以找到。該結(jié)構(gòu)被稱為"隊(duì)列",因?yàn)樗愃朴诂F(xiàn)實(shí)世界中的隊(duì)列-人們在隊(duì)列中等待。
Image Source: pixabay
下面給出了可以在隊(duì)列上執(zhí)行的2個(gè)基本操作。請參考圖4,以更好地了解堆棧操作。
· 進(jìn)隊(duì):將元素插入隊(duì)列的末尾。
· 出隊(duì):從隊(duì)列的開頭刪除元素。
Fig 4. Visualization of Basic Operations of Queues
· 用于管理多線程中的線程。
· 用于實(shí)施排隊(duì)系統(tǒng)(例如:優(yōu)先級隊(duì)列)。
哈希表是一種數(shù)據(jù)結(jié)構(gòu),用于存儲(chǔ)具有與每個(gè)鍵相關(guān)聯(lián)的鍵的值。此外,如果我們知道與值關(guān)聯(lián)的鍵,則它有效地支持查找。因此,無論數(shù)據(jù)大小如何,插入和搜索都非常有效。
當(dāng)存儲(chǔ)在表中時(shí),直接尋址使用值和鍵之間的一對一映射。但是,當(dāng)存在大量鍵值對時(shí),此方法存在問題。該表將具有很多記錄,并且非常龐大,考慮到典型計(jì)算機(jī)上的可用內(nèi)存,該表可能不切實(shí)際甚至無法存儲(chǔ)。為避免此問題,我們使用哈希表。
名為哈希函數(shù)(h)的特殊函數(shù)用于克服直接尋址中的上述問題。
在直接訪問中,帶有密鑰k的值存儲(chǔ)在插槽k中。使用哈希函數(shù),我們可以計(jì)算出每個(gè)值都指向的表(插槽)的索引。使用給定鍵的哈希函數(shù)計(jì)算的值稱為哈希值,它表示該值映射到的表的索引。
· h:哈希函數(shù)
· k:應(yīng)確定其哈希值的鍵
· m:哈希表的大小(可用插槽數(shù))。一個(gè)不接近2的精確乘方的素?cái)?shù)是m的一個(gè)不錯(cuò)的選擇。
Fig 5. Representation of a Hash Function
· 1→1→1
· 5→5→5
· 23→23→3
· 63→63→3
從上面給出的最后兩個(gè)示例中,我們可以看到,當(dāng)哈希函數(shù)為多個(gè)鍵生成相同的索引時(shí),就會(huì)發(fā)生沖突。我們可以通過選擇合適的哈希函數(shù)h并使用鏈接和開放式尋址等技術(shù)來解決沖突。
· 用于實(shí)現(xiàn)數(shù)據(jù)庫索引。
· 用于實(shí)現(xiàn)關(guān)聯(lián)數(shù)組。
· 用于實(shí)現(xiàn)"設(shè)置"數(shù)據(jù)結(jié)構(gòu)。
樹是一種層次結(jié)構(gòu),其中數(shù)據(jù)按層次進(jìn)行組織并鏈接在一起。此結(jié)構(gòu)與鏈接列表不同,而在鏈接列表中,項(xiàng)目以線性順序鏈接。
在過去的幾十年中,已經(jīng)開發(fā)出各種類型的樹木,以適合某些應(yīng)用并滿足某些限制。一些示例是二叉搜索樹,B樹,紅黑樹,展開樹,AVL樹和n元樹。
顧名思義,二進(jìn)制搜索樹(BST)是一種二進(jìn)制樹,其中數(shù)據(jù)以分層結(jié)構(gòu)進(jìn)行組織。此數(shù)據(jù)結(jié)構(gòu)按排序順序存儲(chǔ)值,我們將在本課程中詳細(xì)研究這些值。
二叉搜索樹中的每個(gè)節(jié)點(diǎn)都包含以下屬性。
· key:存儲(chǔ)在節(jié)點(diǎn)中的值。
· left:指向左孩子的指針。
· 右:指向正確孩子的指針。
· p:指向父節(jié)點(diǎn)的指針。
二叉搜索樹具有獨(dú)特的屬性,可將其與其他樹區(qū)分開。此屬性稱為binary-search-tree屬性。
令x為二叉搜索樹中的一個(gè)節(jié)點(diǎn)。
· 如果y是x左子樹中的一個(gè)節(jié)點(diǎn),則y.key≤x.key
· 如果y是x的右子樹中的節(jié)點(diǎn),則y.key≥x.key
Fig 6. Visualization of Basic Terminology of Trees.
· 二叉樹:用于實(shí)現(xiàn)表達(dá)式解析器和表達(dá)式求解器。
· 二進(jìn)制搜索樹:用于許多不斷輸入和輸出數(shù)據(jù)的搜索應(yīng)用程序中。
· 堆:由JVM(Java虛擬機(jī))用來存儲(chǔ)Java對象。
· Trap:用于無線網(wǎng)絡(luò)。
堆是二叉樹的一種特殊情況,其中將父節(jié)點(diǎn)與其子節(jié)點(diǎn)的值進(jìn)行比較,并對其進(jìn)行相應(yīng)排列。
讓我們看看如何表示堆。堆可以使用樹和數(shù)組表示。圖7和8顯示了我們?nèi)绾问褂枚鏄浜蛿?shù)組來表示二叉堆。
Fig 7. Binary Tree Representation of a Heap
Fig 8. Array Representation of a Heap
堆可以有2種類型。
· 最小堆-父項(xiàng)的密鑰小于或等于子項(xiàng)的密鑰。這稱為min-heap屬性。根將包含堆的最小值。
· 最大堆數(shù)-父項(xiàng)的密鑰大于或等于子項(xiàng)的密鑰。這稱為max-heap屬性。根將包含堆的最大值。
· 用于實(shí)現(xiàn)優(yōu)先級隊(duì)列,因?yàn)榭梢愿鶕?jù)堆屬性對優(yōu)先級值進(jìn)行排序。
· 可以在O(log n)時(shí)間內(nèi)使用堆來實(shí)現(xiàn)隊(duì)列功能。
· 用于查找給定數(shù)組中k個(gè)最小(或最大)的值。
· 用于堆排序算法。
一個(gè)圖由一組有限的頂點(diǎn)或節(jié)點(diǎn)以及一組連接這些頂點(diǎn)的邊組成。
圖的順序是圖中的頂點(diǎn)數(shù)。圖的大小是圖中的邊數(shù)。
如果兩個(gè)節(jié)點(diǎn)通過同一邊彼此連接,則稱它們?yōu)橄噜徆?jié)點(diǎn)。
如果圖形G的所有邊緣都具有指示什么是起始頂點(diǎn)和什么是終止頂點(diǎn)的方向,則稱該圖形為有向圖。
我們說(u,v)從頂點(diǎn)u入射或離開頂點(diǎn)u,然后入射到或進(jìn)入頂點(diǎn)v。
自環(huán):從頂點(diǎn)到自身的邊。
如果圖G的所有邊緣均無方向,則稱其為無向圖。它可以在兩個(gè)頂點(diǎn)之間以兩種方式傳播。
如果頂點(diǎn)未連接到圖中的任何其他節(jié)點(diǎn),則稱該頂點(diǎn)為孤立的。
Fig 9. Visualization of Terminology of Graphs
· 用于表示社交媒體網(wǎng)絡(luò)。每個(gè)用戶都是一個(gè)頂點(diǎn),并且在用戶連接時(shí)會(huì)創(chuàng)建一條邊。
· 用于表示搜索引擎的網(wǎng)頁和鏈接。互聯(lián)網(wǎng)上的網(wǎng)頁通過超鏈接相互鏈接。每頁是一個(gè)頂點(diǎn),兩頁之間的超鏈接是一條邊。用于Google中的頁面排名。
· 用于表示GPS中的位置和路線。位置是頂點(diǎn),連接位置的路線是邊。用于計(jì)算兩個(gè)位置之間的最短路徑。
[1]算法簡介,第三版,作者:托馬斯·H·科門(Thomas H. Cormen),查爾斯·E·雷森(Charles E. Leiserson),羅納德·L·里維斯特(Ronald L. Rivest)和克利福德·斯坦(Clifford Stein)。
[2]來自Wikipedia的數(shù)據(jù)結(jié)構(gòu)列表
審核編輯:湯梓紅
評論
查看更多