【数据结构】复杂度
📖什么是数据结构?
数据结构(Data Structure)是计算机存储、组织数据的方式,指相互之间存在一种或多种特定关系的数据元素集合。
📖什么是算法?
算法(Algorithm)就是定义良好的计算过程,它取一个或一组良好的值作为输入,并产生出一个或者一组值作为输出。简单来说算法就是一系列的计算步骤,用来将输入数据转化成输出结果。
📖算法效率
通常我们会用复杂度去衡量一个算法的好坏。算法在编写成可执行程序后,运行时需要消耗时间资源和空间资源(内存资源)。因此衡量一个算法的好坏,一般是从时间和空间两个维度来衡量的,即时间复杂度和空间复杂度。
时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法的运行所需要的额外空间。在计算机发展的早期,计算机的存储容量很小,所以对空间复杂度要求很高,但是现在随着计算机行业的快速发展,计算机的存储容量已经达到了很高的程度,内存成本逐渐降低。所以我们如今已经不再需要特别关心一个算法的空间复杂度。
📖时间复杂度
定义:
在计算机科学中,算法的时间复杂度是一个函数,它定量描述了该算法的运行时间。一个算法执行所消耗的时间,从理论上来说,是不能算出来的,只有你把你的程序放在机器上跑起来,才能知道。但是我们需要算法都上机测试嘛?是可以都上机测试,但是这很麻烦,并且同一个程序在不同的机器上运行时间可能差异很大,所以我们有了时间复杂度的分析方法。一个算法所花费的时间与其中语句的执行次数成正比例,算法中的基本操作执行的次数,为算法的时间复杂度。
即:找到某条基本语句与问题规模N之间的数学表达式,就是算出了该算法的时间复杂度。
🔖大O的渐进表示法
实际中我们计算时间复杂度的时候其实并不需要计算精确的执行次数,而只需要知道大概执行次数,所以这里我们引入了大O的渐进表示法。其中大O符号是用于描述函数渐进行为的数学符号。
推导大O阶的方法:
- 用常数1取代运行时间中的所有加法常数
- 在修改后的运行次数函数中,只保留最高阶项
- 如果最高阶项存在且系数是不唯1的常系数,则去除最高项的系数,得到的结果就是大O阶
- 如果最终结果是O(1),则表示常数次,并不是代表一次
- 最坏情况:
任意输入规模的最大运行次数(上界) - 平均情况:
任意输入规模的期望运行次数 - 最好情况
任意输入规模的最小运行次数(下界)
一般我们比较关心的是一个算法的最坏情况。
🔖常见时间复杂度计算举例
冒泡排序:
// 计算BubbleSort的时间复杂度?
void BubbleSort(int* a, int n)
{
assert(a);
for (size_t end = n; end > 0; --end)
{
int exchange = 0;
for (size_t i = 1; i < end; ++i)
{
if (a[i - 1] > a[i])
{
Swap(&a[i - 1], &a[i]);
exchange = 1;
}
}
if (exchange == 0)
break;//如果没有条语句,最好情况也是O(N*N)
}
}
- 最好情况:�(�)
- 最坏情况:�(�2)
最好情况就是数组本身有序,虽然它有序,但是计算机最初并不知道它是有序的,仍需要遍历一遍数组才能知道它是有序的,因此冒泡排序的最好情况是:�(�)
冒泡排序一趟可以排好一个元素,最坏情况是数组完全逆序,则第一趟需要交换�−1次,第二趟需要交换�−2次…直到最后一趟只交换一次,把所有的交换次数加起来就得到了冒泡排序最坏情况下的时间复杂度,其实也就是一个等差数列求和,所以最会情况下的时间复杂度是�(�2)
二分查找:
// 计算BinarySearch的时间复杂度?
int BinarySearch(int* a, int n, int x)
{
assert(a);
int begin = 0;
int end = n - 1;
// [begin, end]:begin和end是左闭右闭区间,因此有=号
while (begin <= end)
{
int mid = begin + ((end - begin) >> 1);
if (a[mid] < x)
begin = mid + 1;
else if (a[mid] > x)
end = mid - 1;
else
return mid;
}
return -1;
}
- 最好情况:�(1)
- 最坏情况:�(���2�)
最好情况是第一次查找就找到目标值,此时时间复杂度就是�(1)
二分查找中每一次查找要么找到目标值,要么可以排除掉一半数据,因此最坏情况是执行到当区间只剩下一个值的时候,用数学语言来描述这个过程就是:每折半查找一次就会除一次二,一直到结果为1的时候,二分查找结束。�/2/2/2...../2=1。计算执行次数就是看除了多少次2。其结果是除了���2�个2,所以最坏情况就是�(���2�),一般可以把简写成�(����)(仅限于时间复杂度,且只有当底数是2的时候才能简化)
�(�)与�(���2�)的对比:
� | 1000 | 100� | 10亿 |
---|---|---|---|
�(�) | 1000 | 100� | 10亿 |
�(���2�) | 10 | 20 | 30 |
可见�(���2�)相较于�(�)在效率上有很大的提升,虽然二分查找的效率很高,但是他有一个致命的限制条件就是数组有序,对数组排序也是需要消耗时间的,因此二分查找在实际中使用的并不是很多,用的更多的是红黑树,它的时间复杂度也是�(���2�)
递归阶乘
// 计算阶乘递归Fac的时间复杂度?
long long Fac(size_t N)
{
if (0 == N )
return 1;
return Fac(N - 1) * N;
}
- 时间复杂度:�(�)
这里涉及到了递归,Fac
一共被递归调用了N次,且每一次Fac
中的执行次数是1,所以总的执行次数就是�+1个1相加,因此时间复杂度就是�(�)
斐波那契数列
// 计算斐波那契递归Fib的时间复杂度?
long long Fib(size_t N)
{
if (N < 3)
return 1;
return Fib(N - 1) + Fib(N - 2);
}
- 时间复杂度:�(2�)
用递归去求解斐波那契额数列,它的时间复杂度是等比数列求和,最终的时间复杂度就是�(2�)
常见时间复杂度关系
🔖面试题:消失的数字
题目出处:消失的数字
分析:
这道题大家很容易想到的方法就是先对数组进行排序然后再利用二分查找找到缺失的数字。但是注意题目限制了时间复杂度只能在�(�),而我们常用的冒泡排序时间复杂度是�(�2),快排的时间复杂度是�(�∗����),都不符合题目要求,因此这条路要被我们Pass掉。我们可以考虑异或来解决这个问题,异或有下面两条性质:a^a=0
、a^0=a
,并且异或满足交换律和结合律,所以我们可以先让0~N的所有数字进行异或,然后再和数组里面的所有元素进行异或,最终的结果就是缺失的那个数字,这种方法只需要遍历两边数组,时间复杂度是�(�)。下面来看一下这种思路的代码实现:
int missingNumber(int* nums, int numsSize){
int num = 0;
for(int i = 0; i <= numsSize; i++)
{
num = num ^ i;
}
for(int i = 0; i < numsSize; i++)
{
num = num ^ nums[i];
}
return num;
}
处理上面的这种思路还可以直接利用求和公式算出0~N的总和,再减去数组中的所有元素,最终的结果就是缺失的数字,此种方法只需要遍历一遍数组,因此时间复杂度也是�(�)。
📖空间复杂度
定义:
空间复杂度也是一个数学表达式,是对一个算法在运行过程中临时占用存储空间大小的量度。空间复杂度不是程序占用了多少bytes的空间,因为这个也没太大意义,所以空间复杂度算的是变量的个数。空间复杂度的计算规则和时间复杂度类似,也采用大O渐进表示法。
注意:函数运行时所需要的栈空间(存储参数、局部变量、一些寄存器信息等)在编译期间已经确定好了,因此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定。
一般常见的空间复杂度都是�(1)或者�(�)(额外开辟数组)。
🔖递归的空间复杂度
- 情形一
// 计算阶乘递归Fac的空间复杂度?
long long Fac(size_t N)
{
if (0 == N )
return 1;
return Fac(N - 1) * N;
}
首先每调用一次函数都会创建一个函数栈帧,而每个函数的空间复杂度可以看作是�(1),一共递归调用了N+1次Fac
函数,因此空间复杂度是�(�)。 这里调用的N+1次Fac
函数栈帧的地址是不同的,因为它们是递归调用的。
void Fun1()
{
int a = 0;
printf("%p\n", &a);
}
void Fun2()
{
int b = 0;
printf("%p\n", &b);
}
int main()
{
Fun1();
Fun2();
return 0;
}
程序先调用Fun1
函数,创建其相应的函数栈帧,调用结束的时候函数栈帧会被销毁,也就是把空间还给操作系统,接下来调用Fun2
函数,创建其相应的函数栈帧,这也就是为什么两次打印的地址是一样的,因为Fun1
调用结束的时候把空间还给了操作系统。
void Fun1()
{
int a = 0;
printf("%p\n", &a);
}
void Fun2()
{
int b = 0;
printf("%p\n", &b);
Fun1();
}
int main()
{
Fun2();
return 0;
}
此时两次打印的地址不同,因为是在Fun2
函数中调用的Fun1
函数,它的执行过程是:先在主函数中调用Fun2
函数,创建相应的函数栈帧,接着在Fun2
函数中调用了Fun1
函数,所以接下来会去创建Fun1的函数栈帧,这就是为什么两次打印的地址不同,函数的递归调用就是类似这样。
- 情形二
// 计算斐波那契递归Fib的空间复杂度?
long long Fib(size_t N)
{
if (N < 3)
return 1;
return Fib(N - 1) + Fib(N - 2);
}
与普通递归不同的是,这里一次函数调用中会再递归调用两次,具体的调用过程以及调用次序如上图所示,第四次调用结束后函数栈指会销毁,接着进行第五次函数调用,因此第四次调用与第五次调用所创建的函数栈帧其实是同一块,同理第三次和第六次函数调用所创建的函数栈帧也是同一块。综上所述,当求N的斐波那契数列时,一共只会占用�−1个函数栈帧的空间,因为有很多函数栈帧的创建用的是同一块空间,因此递归求解斐波那契数列的空间复杂度是�(�),这也说明时间一去不复返,而空间可以重复利用。
🔖面试题:轮转数组
这道题可以采用暴力求解的方法,即一次旋转一个数字然后轮转k次,但这样做的时间复杂度是�(�2),对于这种轮转问题我们可以采用下面时间复杂度为�(�),空间复杂度是�(1)的三步来解决:
- 前n-k个逆置
- 后k个逆置
- 整体逆置
void rotate(int* nums, int numsSize, int k){
k = k % numsSize;//一定要记得模,这样可以节约时间还可以避免越界
int i = 0;
int j = 0;
int tmp = 0;
for (i = 0, j = numsSize - k - 1; i < j; i++,j--)//对前n-k个进行逆置
{
tmp = nums[i];
nums[i] = nums[j];
nums[j] = tmp;
}
for (i = numsSize - k, j = numsSize - 1; i < j; i++, j--)//对后k个进行逆置
{
tmp = nums[i];
nums[i] = nums[j];
nums[j] = tmp;
}
for (i = 0, j = numsSize - 1; i < j; i++, j--)//对整体进行逆置
{
tmp = nums[i];
nums[i] = nums[j];
nums[j] = tmp;
}
}
针对上面这个题我们还可以采用以空间换时间的办法,即新创建一个数组把原数组的后k个拷贝到新数组的前面,再把原数组的前n-k个拷贝到新数组的后面:
void rotate(int* nums, int numsSize, int k)
{
k %= numsSize;
int* arr = (int*)malloc(sizeof(int)*numsSize);
memcpy(arr, nums+(numsSize-k), sizeof(int)*k);
memcpy(arr+k, nums, sizeof(int)*(numsSize-k));
memcpy(nums, arr, sizeof(int)*numsSize);
free(arr);
}
此时的时间复杂度是�(�),表面上我们看着时间复杂度像是�(1),但其实并不是,因为memcpy
函数内部是一个字节一个字节进行拷贝的,它的时间复杂度是�(�),由于新开了一个数组,所以空间复杂度也是�(�)。
今天的分享到这里就结束啦!如果觉得文章还不错的话,可以三连支持一下,您的支持就是春人前进的动力!
- 点赞
- 收藏
- 关注作者
评论(0)