- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

程序员面试必备的八大数据结构

AI 菌发表于 2021/08/04 23:09:54 2021/08/04

【摘要】写在前面：大家好！我是【AI 菌】，一枚爱弹吉他的程序员。我热爱AI、热爱分享、热爱开源！这博客是我对学习的一点总结与记录。如果您也对深度学习、机器视觉、算法、Python、C++ 感兴趣，可以关注我的动态，我们一起学习，一起进步~ 我的博客地址为：【AI 菌】的博客我的Github项目地址是：【AI 菌】的Github 作者：Krahets 链接...

写在前面：大家好！我是【AI 菌】，一枚爱弹吉他的程序员。我热爱AI、热爱分享、热爱开源！这博客是我对学习的一点总结与记录。如果您也对 深度学习、机器视觉、算法、Python、C++ 感兴趣，可以关注我的动态，我们一起学习，一起进步~
我的博客地址为：【AI 菌】的博客
我的Github项目地址是：【AI 菌】的Github

作者：Krahets
链接：https://leetcode-cn.com/leetbook/read/illustration-of-algorithm/50e446/
来源：力扣（LeetCode）

文章目录

前言

数据结构是为实现对计算机数据有效使用的各种数据组织形式，服务于各类计算机操作。不同的数据结构具有各自对应的适用场景，旨在降低各种算法计算的时间与空间复杂度，达到最佳的任务执行效率。

如下图所示，常见的数据结构可分为线性数据结构与非线性数据结构，具体为：「数组」、「链表」、「栈」、「队列」、「树」、「图」、「散列表」、「堆」。

从零开始学习算法的同学对数据结构的使用方法可能尚不熟悉，本文将初步介绍各数据结构的基本特点，以及Python3 或 C++ 语言中各数据结构的初始化与构建方法。

一、线性数据结构

(1) 数组

数组是将相同类型的元素存储于连续内存空间的数据结构。根据数组长度可不可变，可分为静态数组和动态数组。

如下图所示，构建静态数组需要在初始化时给定长度，并对数组每个索引元素赋值：

C++代码示例如下：

// 初始化一个长度为 5 的数组 array
int array[5];
// 元素赋值
array[0] = 2;
array[1] = 3;
array[2] = 1;
array[3] = 0;
array[4] = 2;

  
 
  1
  2
  3
  4
  5
  6
  7
  8

或者可以使用直接赋值的初始化方式，代码如下：

int array[] = {2, 3, 1, 0, 2};

  
 
  1

动态数组是经常使用的数据结构，其基于数组和扩容机制实现，相比普通数组更加灵活。常用操作有：访问元素、添加元素、删除元素。

下面采用C++中的vector类来初始化一个动态数组，并向其末尾添加元素。代码如下：

// 初始化动态数组
vector<int> array;

// 向尾部添加元素
array.push_back(2);
array.push_back(3);
array.push_back(1);
array.push_back(0);
array.push_back(2);

  
 
  1
  2
  3
  4
  5
  6
  7
  8
  9

Python代码如下：

# 初始化动态数组
array = []

# 向尾部添加元素
array.append(2)
array.append(3)
array.append(1)
array.append(0)
array.append(2)

  
 
  1
  2
  3
  4
  5
  6
  7
  8
  9

我总结了C++中动态数组类vector的用法，想要快速上手的同学，可以前往学习：【C++养成计划】动态数组 —— 快速上手 STL vector 类（Day14）

(2) 链表

链表以节点为单位，每个元素都是一个独立对象，在内存空间的存储是非连续的。链表的节点对象具有两个成员变量：「值 val」和「后继节点引用 next」。

C++代码如下：

struct ListNode { int val; // 节点值 ListNode *next; // 后继节点引用 ListNode(int x) : val(x), next(NULL) {}
};

  
 
  1
  2
  3
  4
  5

Python代码如下：

class ListNode: def __init__(self, x): self.val = x # 节点值 self.next = None # 后继节点引用

  
 
  1
  2
  3
  4

如下图所示，建立此链表需要实例化每个节点，并构建各节点的引用指向。

C++示例如下：

// 实例化节点
ListNode *n1 = new ListNode(4); // 节点 head
ListNode *n2 = new ListNode(5);
ListNode *n3 = new ListNode(1);

// 构建引用指向
n1->next = n2;
n2->next = n3;

  
 
  1
  2
  3
  4
  5
  6
  7
  8

Python示例如下：

# 实例化节点
n1 = ListNode(4) # 节点 head
n2 = ListNode(5)
n3 = ListNode(1)

# 构建引用指向
n1.next = n2
n2.next = n3

  
 
  1
  2
  3
  4
  5
  6
  7
  8

如果您想进一步学习C++中栈的用法，可以看我的之前写的文章：【C++养成计划】链表 —— 快速上手STL list 类（Day11）

(3) 栈

栈是一种具有 「先入后出」 特点的抽象数据结构，可使用数组或链表实现。

如下图所示，通过常用操作「入栈 push()」,「出栈 pop()」，展示了栈的先入后出特性。

C++代码示例如下：

stack<int> stk;
stk.push(1); // 元素 1 入栈
stk.push(2); // 元素 2 入栈
stk.pop();   // 出栈 -> 元素 2
stk.pop();   // 出栈 -> 元素 1

  
 
  1
  2
  3
  4
  5

Python代码示例如下：

stack = [] # Python 可将列表作为栈使用
stack.append(1) # 元素 1 入栈
stack.append(2) # 元素 2 入栈
stack.pop() # 出栈 -> 元素 2
stack.pop() # 出栈 -> 元素 1

  
 
  1
  2
  3
  4
  5

想进一步学习C++中栈的用法，可以看我的之前写的文章：【C++养成计划】栈 —— 快速上手 STL stack 类（Day12）

(4) 队列

队列是一种具有 「先入先出」 特点的抽象数据结构，可使用链表实现。

如下图所示，通过常用操作「入队 push()」,「出队 pop()」，展示了队列的先入先出特性。

C++示例代码如下：

queue<int> que;
que.push(1); // 元素 1 入队
que.push(2); // 元素 2 入队
que.pop();   // 出队 -> 元素 1
que.pop();   // 出队 -> 元素 2

  
 
  1
  2
  3
  4
  5

Python示例代码如下：

# Python 通常使用双端队列 collections.deque
from collections import deque

queue = deque() # 实例化一个队列
queue.append(1) # 元素 1 入队
queue.append(2) # 元素 2 入队
queue.popleft() # 出队 -> 元素 1
queue.popleft() # 出队 -> 元素 2

  
 
  1
  2
  3
  4
  5
  6
  7
  8

想进一步学习C++中队列的用法，可以看我的之前写的文章：【C++养成计划】队列 —— 快速上手STL queue类（Day13）

二、非线性数据结构

(1) 树

树是一种非线性数据结构，根据子节点数量可分为 「二叉树」 和 「多叉树」，最顶层的节点称为 「根节点 root」。以二叉树为例，每个节点包含三个成员变量：「值 val」、「左子节点 left」、「右子节点 right」 。

如下图所示，建立此二叉树需要实例化每个节点，并构建各节点的引用指向。

C++示例代码如下：

struct TreeNode { int val; // 节点值 TreeNode *left;  // 左子节点 TreeNode *right; // 右子节点 TreeNode(int x) : val(x), left(NULL), right(NULL) {}
};

// 初始化节点
TreeNode *n1 = new TreeNode(3); // 根节点 root
TreeNode *n2 = new TreeNode(4);
TreeNode *n3 = new TreeNode(5);
TreeNode *n4 = new TreeNode(1);
TreeNode *n5 = new TreeNode(2);

// 构建引用指向
n1->left = n2;
n1->right = n3;
n2->left = n4;
n2->right = n5;

  
 
  1
  2
  3
  4
  5
  6
  7
  8
  9
  10
  11
  12
  13
  14
  15
  16
  17
  18
  19

Python示例代码如下：

class TreeNode: def __init__(self, x): self.val = x # 节点值 self.left = None  # 左子节点 self.right = None # 右子节点 # 初始化节点
n1 = TreeNode(3) # 根节点 root
n2 = TreeNode(4)
n3 = TreeNode(5)
n4 = TreeNode(1)
n5 = TreeNode(2)

# 构建引用指向
n1.left = n2
n1.right = n3
n2.left = n4
n2.right = n5

  
 
  1
  2
  3
  4
  5
  6
  7
  8
  9
  10
  11
  12
  13
  14
  15
  16
  17
  18

(2) 图

图是一种非线性数据结构，由 「节点（顶点）vertex」 和 「边 edge」 组成，每条边连接一对顶点。根据边的方向有无，图可分为 「有向图」 和 「无向图」。本文以无向图为例开展介绍。

如下图所示，此无向图的顶点和边集合分别为：

顶点集合： vertices = {1, 2, 3, 4, 5}
边集合： edges = {(1, 2), (1, 3), (1, 4), (1, 5), (2, 4), (3, 5), (4, 5)}

表示图的方法通常有两种：

邻接矩阵：使用数组 vertices 存储顶点，邻接矩阵 edges 存储边； edges[i][j] 代表节点 i+1 和节点 j+1 之间是否有边。

C++代码实现如下：

int vertices[5] = {1, 2, 3, 4, 5};
int edges[5][5] = {{0, 1, 1, 1, 1}, {1, 0, 0, 1, 0}, {1, 0, 0, 0, 1}, {1, 1, 0, 0, 1}, {1, 0, 1, 1, 0}};

  
 
  1
  2
  3
  4
  5
  6

邻接表：使用数组 vertices 存储顶点，邻接表 edges 存储边。 edges 为一个二维容器，第一维 i 代表顶点索引，第二维 edges[i]存储此顶点对应的边集合；例如 edges[0] = [1,2,3,4] 代表 vertices[0] 的边集合为 [1,2,3,4] 。
C++代码实现如下：

int vertices[5] = {1, 2, 3, 4, 5};
vector<vector<int>> edges;

vector<int> edge_1 = {1, 2, 3, 4};
vector<int> edge_2 = {0, 3};
vector<int> edge_3 = {0, 4};
vector<int> edge_4 = {0, 1, 4};
vector<int> edge_5 = {0, 2, 3};
edges.push_back(edge_1);
edges.push_back(edge_2);
edges.push_back(edge_3);
edges.push_back(edge_4);
edges.push_back(edge_5);

  
 
  1
  2
  3
  4
  5
  6
  7
  8
  9
  10
  11
  12
  13

邻接矩阵 VS 邻接表：
邻接矩阵的大小只与节点数量有关，即 N^2，其中 N 为节点数量。因此，当边数量明显少于节点数量时，使用邻接矩阵存储图会造成较大的内存浪费。
因此，邻接表适合存储稀疏图（顶点较多、边较少）；邻接矩阵适合存储稠密图（顶点较少、边较多）。

(3) 散列表

散列表是一种非线性数据结构，通过利用 Hash 函数将指定的「键 key」映射至对应的「值 value」，以实现高效的元素查找。

设想一个简单场景：小力、小特、小扣的学号分别为 10001, 10002, 10003 。现需求从「姓名」查找「学号」。

则可通过建立姓名为 key ，学号为 value 的散列表实现此需求，C++代码如下：

// 初始化散列表
unordered_map<string, int> dic;

// 添加 key -> value 键值对
dic["小力"] = 10001;
dic["小特"] = 10002;
dic["小扣"] = 10003;

// 从姓名查找学号
dic.find("小力")->second; // -> 10001
dic.find("小特")->second; // -> 10002
dic.find("小扣")->second; // -> 10003

  
 
  1
  2
  3
  4
  5
  6
  7
  8
  9
  10
  11
  12

Python代码如下：

# 初始化散列表
dic = {}

# 添加 key -> value 键值对
dic["小力"] = 10001
dic["小特"] = 10002
dic["小扣"] = 10003

# 从姓名查找学号
dic["小力"] # -> 10001
dic["小特"] # -> 10002
dic["小扣"] # -> 10003

  
 
  1
  2
  3
  4
  5
  6
  7
  8
  9
  10
  11
  12

自行设计 Hash 函数：

假设需求：从「学号」查找「姓名」。将三人的姓名存储至以下数组中，则各姓名在数组中的索引分别为 0, 1, 2 。

string names[] = { "小力", "小特", "小扣" };

  
 
  1

此时，我们构造一个简单的 Hash 函数（ % 为取余符号），公式如下：

C++封装函数如下：

int hash(int id) { int index = (id - 1) % 10000; return index;
}

  
 
  1
  2
  3
  4

于是，我们构建了以学号为 key 、姓名对应的数组索引为 value 的散列表。利用此 Hash 函数，则可在 O(1) 时间复杂度下通过学号查找到对应姓名，即：

names[hash(10001)] // 小力
names[hash(10002)] // 小特
names[hash(10003)] // 小扣

  
 
  1
  2
  3

注：以上设计只适用于此示例，实际的 Hash 函数需保证低碰撞率、高鲁棒性等，以适用于各类数据和场景。

(4) 堆

堆是一种基于 「完全二叉树」 的数据结构，可使用数组实现。以堆为原理的排序算法称为 「堆排序」，基于堆实现的数据结构为 「优先队列」。堆分为 「大顶堆」 和 「小顶堆」，大（小）顶堆：任意节点的值不大于（小于）其父节点的值。

完全二叉树定义：设二叉树深度为 kk ，若二叉树除第 kk 层外的其它各层（第 11 至 k-1k−1 层）的节点达到最大个数，且处于第 kk 层的节点都连续集中在最左边，则称此二叉树为完全二叉树。

如下图所示，为包含 1, 4, 2, 6, 8 元素的小顶堆。将堆（完全二叉树）中的结点按层编号，即可映射到右边的数组存储形式。

通过使用「优先队列」的「压入 push()」和「弹出 pop()」操作，即可完成堆排序，C++实现代码如下：

/ 初始化小顶堆
priority_queue<int, vector<int>, greater<int>> heap;

// 元素入堆
heap.push(1);
heap.push(4);
heap.push(2);
heap.push(6);
heap.push(8);

// 元素出堆（从小到大）
heap.pop(); // -> 1
heap.pop(); // -> 2
heap.pop(); // -> 4
heap.pop(); // -> 6
heap.pop(); // -> 8


  
 
  1
  2
  3
  4
  5
  6
  7
  8
  9
  10
  11
  12
  13
  14
  15
  16
  17

Python实现代码如下：

from heapq import heappush, heappop

# 初始化小顶堆
heap = []

# 元素入堆
heappush(heap, 1)
heappush(heap, 4)
heappush(heap, 2)
heappush(heap, 6)
heappush(heap, 8)

# 元素出堆（从小到大）
heappop(heap) # -> 1
heappop(heap) # -> 2
heappop(heap) # -> 4
heappop(heap) # -> 6
heappop(heap) # -> 8

  
 
  1
  2
  3
  4
  5
  6
  7
  8
  9
  10
  11
  12
  13
  14
  15
  16
  17
  18

由于水平有限，博客中难免会有一些错误，有纰漏之处恳请各位大佬不吝赐教！

推荐文章

文章来源: ai-wx.blog.csdn.net，作者：AI 菌，版权归原作者所有，如需转载，请联系作者。

原文链接：ai-wx.blog.csdn.net/article/details/114519112

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

程序员面试必备的八大数据结构

文章目录

前言

一、线性数据结构

(1) 数组

(2) 链表

(3) 栈

(4) 队列

二、非线性数据结构

(1) 树

(2) 图

(3) 散列表

(4) 堆

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品