首页 > 编程语言 >扎实打牢数据结构算法根基,从此不怕算法面试系列之007 week01 02-07 简单的复杂度分析

扎实打牢数据结构算法根基,从此不怕算法面试系列之007 week01 02-07 简单的复杂度分析

时间:2023-04-22 13:06:46浏览次数:38  
标签:02 分析 week01 复杂度 算法 5n data 性能

1、复杂度分析

复杂度分析本身是非常理论化的一个内容,在计算机科学中,有一个专门的学科叫做——计算复杂性理论

很多童鞋看过《算法导论》,这本书的内容很多很强调算法导论。

但是实际上,对于普通程序员来说,不需要过度强调理论化的内容。因为工作中更多面对的是实际的
软件工程,工程化的工作不需要面对太多理论性的东东。

2、复杂度分析

复杂度分析的作用:是为了表示算法的性能。

对于同样一个任务,可能有多个实现方式,即多个算法。这些不同的算法,它们的时间性能是否有差异呢?


我们虽然可以用一个测试用例,或者一组测试用例实际比较性能差异。
但是,这样的比较结果有局限性。


比如,需要保证运行不同算法的计算机硬件设备的性能一致,甚至深入的说,他们的OS当时的状态都需要是一致的。
这本身很难保证,而且测试结果也与我们的测试用例设计和用例输入相关。


而且,最重要的是这样比较是事后的。

如何突破局限性,如何事前比较呢?
种种这样的需求,都需要我们有一套工具,从数学的层面,用抽象的方式,判断一个算法的性能是怎样的?

为了回应这样的需求,就产生了复杂度分析这样一个概念。

3、复杂度分析和算法性能的关系

复杂度分析,如何表示算法的性能呢?

需要注意的是,算法复杂度分析通常考虑最坏的情况。


这样的思想非常普遍,比如上班时,为了不迟到,考虑最长需要多少时间,甚至将堵车的时间都考虑进去。

即,复杂度分析,表示的是算法运行的上界。


扎实打牢数据结构算法根基,从此不怕算法面试系列之007 week01 02-07 简单的复杂度分析_复杂度分析

对于我们的线性查找法代码,我们来进行一个复杂度分析吧,代码再一次贴出来:

public static <E> int search(E [] data,E target){
    for (int i = 0; i < data.length; i++)
        if (data[i].equals(target))
            return i;
    return -1;
}

扎实打牢数据结构算法根基,从此不怕算法面试系列之007 week01 02-07 简单的复杂度分析_复杂度分析_02

具体的分析过程如下:
n = data.length
T 表示时间
T和n的关系到底是怎样的?
T = n?n个元素全部扫描了一遍? 就是n?
T = 2n?if里有比较、有返回结果这2步 就是2n?
T = 3n? 其实if中的data[i],要在数组data中找到i这个元素,是一步寻址,也需要算作一个子步骤。 3n了?
T = 4n?for循环中也包含每次要做的事情,i<data.length,也是一个判断操作,所以4n?

T = 5n?for循环中还有一个i++的操作,所以5n?
T = 5n+2? int i =0;加1次,return -1;加1次,所T=5n+2?
……


其实,再继续分析下去还可以分析出很多可能,就不继续分析了,为什么不继续了呢?


因为真的分析的话,拿出for循环对应的汇编代码,看看这个循环执行了多少指令?


可是拿出汇编代码也不够,因为汇编代码对应着机器指令,而机器指令不仅仅是代码有多少行而已,
还要追溯到运行代码的CPU架构上,有些复杂指令在有些CPU上,就一个指令,但在另外一些CPU上,可能就是多个指令。


对于上层应用软件开发者来说,分析清楚每一行高级语言代码对应着多少机器指令,是一件非常困难,甚至说不可能的事情,其实也没有必要。

而且即便T=5n+2,那这个等式的时间单位是多少呢?是毫秒ms嘛?肯定不对应时间,对应的是指令数,但是一条指令在cpu中执行多久我们知道嘛?

我们不知道。


所以,这些其实我们都不需要考虑,我们需要进行一个化简。这也是计算机科学家们定义复杂度分析这个概念时做过的事儿,没错,他们做了化简。


我们不需要知道执行这样一个循环,对这n个元素操作,每一次循环需要执行多少个指令;
我们只需要知道,整个算法和这个data数组的大小,和这个数据规模n成一个正比的关系即可。


4、O(n)

这个就记作O(n),表示的就是运行时间和数据规模n之间的一个正比关系。
进一步看,如果:
T = c1*n + c2
这个算法我们就可以记作O(n),即常数c1、c2都被我们忽略掉了,即算法复杂度的世界中,常数不重要。

5、复杂度描述的是什么?

复杂度描述的是:随着数据规模的增大,算法性能的变化趋势。

扎实打牢数据结构算法根基,从此不怕算法面试系列之007 week01 02-07 简单的复杂度分析_复杂度分析_03

假设有2个算法,分别是T1和T2,它们的详细情况如下:

T1 = 10000n
T2 = 2n²
第一个算法 O(n)级别的算法,第二个算法O(n²)级别的算法。
从复杂度理论的角度来看,第一个算法优于第二个算法。

**因为总是会存在某一临界点n0,当n>n0,T1<T2。
可以计算出,这里的临界点n0为5000。
一旦数据规模大于5000,算法一的性能优势就体现出来了,而且n越大,体现的越明显。

所以O(n)描述的就是随着n的变化,算法的性能的变化趋势,

而不是说n取某个值时,算法的性能。


实际上,如果测试数据小于5000,比如为100时,第二个算法O(n²)反而优于第一个算法O(n);


但是评价算法性能,我们要看n逐渐上涨的情况,甚至看n无穷大的情况



标签:02,分析,week01,复杂度,算法,5n,data,性能
From: https://blog.51cto.com/u_15708686/6215236

相关文章

  • 扎实打牢数据结构算法根基,从此不怕算法面试系列之003 week01 02-03 代码实现线性查找
    1、算法描述在数组中逐个查找元素,即遍历。2、思路原理如算法描述,基本是最简单的代码块了,没有什么额外的原理。3、初步的代码实现线性查找法初步的代码实现:packagecom.mosesmin.datastructure.week01.chap02;/***@Misson&Goal代码以交朋友、传福音*@ClassNameLinearSearc......
  • 02:基础入门-数据包拓展
    1、网站解析对应简要网站搭建过程涉及到的攻击层面?(源码、搭建平台、系统、网络层等)涉及到的安全问题?(目录、敏感文件、弱口令、IP及域名等)2、HTTP/S数据包1.无代理request请求数据包response返回数据包2.有代理request请求数据包proxy代理服务器response返回数......
  • AGC002E Candy Piles
    尝试考虑\(n=1,n=2,n=3\)的必败必胜条件,寻找一些结论,但是发现即使是\(n=3\)胜负情况已经有些不可描述了,说明我们必须尝试转化问题的形式。注意到操作是全局减,常见的转化是差分,但是差分后的操作仍然没有优秀的性质。继续思考,可以得到一个恰当的转化:注意到游戏结束当且仅当最......
  • 文章学习:基于AVX-512指令集的同态加密算法中大整数运算性能优化与突破
    学习文章:英特尔×同态科技|基于AVX-512指令集的同态加密算法中大整数运算性能优化与突破文章人工智能的安全隐患ChatGPT的成功大部分来源于海量的数据支撑和丰富的数据维度,基于13亿参数量的庞大模型,随着用户的不断涌入,ChatGPT不断迭代进化新的“知识”,而在模型表达能力的增......
  • 热题100_20230421
    128、最长连续序列题目说明给定一个未排序的整数数组nums,找出数字连续的最长序列(不要求序列元素在原数组中连续)的长度。请你设计并实现时间复杂度为O(n)的算法解决此问题。解题思路1:排序此法不满足时间复杂度为O(n)先对数组进行排序,当遇到不连续的数时则重置当前的序列......
  • [P8766 [蓝桥杯 2021 国 AB] 异或三角]题解
    P8766[蓝桥杯2021国AB]异或三角题目描述分析题目中给出了三个限制首先我们不妨设\(a,b\ltc\),则而由于我们把\(c\)作为了最大值,原题需要有序对\((a,b,c)\)所以\(ans\ast3\)1.\(1\leqa,b,c\leqn\)2.\(a\oplusb\oplusc=0\)3.\(a+b\gtc\)而在枚举过程中,......
  • 物联网---02.Modbus协议
    一、简介Modbus由MODICON公司于1979年开发,是一种工业现场总线协议标准。1996年施耐德公司推出基于以太网TCP/IP的Modbus协议:ModbusTCP。Modbus协议是一项应用层报文传输协议,包括ASCII、RTU、TCP三种报文类型。标准的Modbus协议物理层接口有RS232、RS422、RS485和以......
  • 放逐 | HBOI 2023 游寄
    本来是四月一日的事情,但是现在还是发在这里吧。高一。\(\sfHBOI2023\)上一次来hust还是上次省选呢。进考场了。???你tm距离开考20分钟才开电脑?我还tm要整vscode呢!我还要打缺省源呢!然后傻逼鼠标滚轮寄了,弄了半天,换到了考场最后面的位置。这意味着确认签字又要被排......
  • mysql学习笔记2023年3月10日
    navicat 用法 ①创建数据库  ②创建数据表 外键  ③新建查询  ④转储SQL文件(执行的就是mysqldump命令) ⑤执行SQL文件前,需要先创建数据库临时表 (select*fromtb1)asB;  临时表表名为B select sidfromB; ......
  • 02-目录---数据结构与算法
    第01章:数组(即顺序表)的基本实现数组头文件定义:链接初始化、清空、销毁数组:链接输入元素创建数组、打印数组:链接数组扩容:链接在数组尾部追加若干元素:链接插入元素x:链接按位置删除元素:链接删除元素x:链接定位元素x:链接第02章:数组其他算法实现合并数组:链接1:链接2:链接3:链......