首页 > 编程语言 >【基础算法】二分查找

【基础算法】二分查找

时间:2023-10-22 23:11:34浏览次数:37  
标签:二分 arr mid 算法 查找 low 数组

一、算法原理

二分查找适用于在有序数组中查找一个元素,使用了分治思想。

每次比较要查找的元素与数组的中间元素,如果要查找的元素 > 中间元素,在数组后半部分继续查找;如果要查找的元素 < 中间元素,在数组前半部分继续查找;如果要查找的元素 = 中间元素,查找结束。

二分查找通过比较要查找的元素与数组的中间元素,每次将待查找的区间缩小为之前的一半,直到找到要查找的元素,或者区间被缩小为 0。

 

示例:在有序数组 arr = [8,11,19,23,27,33,45,55,67] 中查找数字 33 的位置。

 

二分查找如果没找到目标数字,那么最后 mid 指向的位置,就是保持数组有序,目标数字插入数组应该在的位置。

 

示例:在有序数组 arr = [8,11,19,23,27,33,45,55,67] 中查找数字 32 的位置。

 

二、代码实现

2.1 循环实现

/**
 * 二分查找,时间复杂度:O(logn),空间复杂度:O(1)
 *
 * @param arr    有序数组
 * @param target 要查找的目标数字
 * @return 数组包含目标数字,返回目标数字的位置;数组不包含目标数字,返回目标数字应该插入数组的位置
 */
public static int binarySearch(int[] arr, int target) {
    int low = 0;
    int high = arr.length - 1;
    int mid = -1;

    while (low <= high) {
        mid = (low + high) >> 1;
        if (target < arr[mid]) { // 目标数字 < 数组中间数字,在左半部分查找
            high = mid - 1;
        } else if (target > arr[mid]) { // 目标数字 > 数组中间数字,在右半部分查找
            low = mid + 1;
        } else { // 目标数字 = 数组中间数字,找到
            return mid;
        }
    }
    return mid;
}

注意点:

1. 循环退出条件

  low <= high,不是 low < high。

2. low 和 high 的更新

  low = mid + 1,high = mid - 1,如果写成 low = mid,high = mid,会出现死循环。比如 low = 2,high = 2,如果 arr[2] != target,会死循环。

 

2.2 递归实现

/**
 * 二分查找,递归实现
 *
 * @param arr    有序数组
 * @param low    待查找的区间左边界
 * @param high   待查找的区间右边界
 * @param target 要查找的目标数字
 * @return 数组包含目标数字,返回目标数字的位置;数组不包含目标数字,返回 -1
 */
public static int binarySearch(int[] arr, int low, int high, int target) {
    if (low > high) {
        return -1;
    }
    int mid = (low + high) >> 1;
    if (target < arr[mid]) {
        return binarySearch(arr, low, mid - 1, target);
    } else if (target > arr[mid]) {
        return binarySearch(arr, mid + 1, high, target);
    } else {
        return mid;
    }
}

 

三、二分查找的速度惊人

二分查找是一种非常高效的查找算法,其最坏时间复杂度为 O(log2n)。分析过程如下:

假设数据大小是 n,每次查找后数据都会缩小为原来的一半,也就是会除以 2。最坏情况下,直到查找区间被缩小为空,才停止。被查找区间的大小变化情况是 n, n/2, n/4, n/8...n/2k,当 n/2k = 1 时,k 的值就是区间缩小的次数,每次区间缩小只涉及两个数字的大小比较,所以,经过 k 次区间缩小,时间复杂度就是 O(k)。由 n/2k = 1 可知,k = log2n,所以,二分查找的最坏时间复杂度为 O(log2n)。

 

O(log2n) 的时间复杂度是非常恐怖的,即使 n 特别大,log2n 也很小,比如 n = 232,约等于 42 亿,log2n = 32。也就是说,在 42 亿个数字中使用二分查找,最多只需要比较 32 次。

 

四、应用场景及局限性

二分查找虽然非常高效,但是也有很大的局限性,主要表现在以下四方面:

 

1. 依赖数组随机访问的特点

二分查找需要按照下标随机访问元素,数组按照下标随机访问元素的时间复杂度是 O(1),而链表随机访问的时间复杂度是 O(n)。所以,如果数据使用链表存储,二分查找的时间复杂就会变得很高。

 

2. 针对的是有序数组

二分查找数据必须是有序的。如果数据无序,需要先排序。我们知道,排序的时间复杂度最低是 O(nlogn)。所以,如果是一组静态数据,没有频繁地插入、删除操作,我们可以进行一次排序,多次二分查找。这样排序的成本可被均摊,二分查找的边际成本就会比较低。但是,如果数据有频繁的插入和删除操作,要想用二分查找,要么每次插入、删除操作之后保证数据仍然有序,要么在每次二分查找之前都先进行排序。无论哪种方法,维护有序的成本都是很高的。

所以,二分查找只能用在插入、删除操作不频繁,一次排序多次查找的场景中。针对动态变化的数据集合,二分查找将不再适用。

 

3. 数据量太小不适合二分查找

如果要处理的数据量很小,完全没有必要用二分查找,顺序遍历就足够了。比如在一个大小为 10 的数组中查找一个元素,不管用二分查找还是顺序遍历,查找速度都差不多。只有数据量比较大的时候,二分查找的优势才会比较明显。

但是,有个例外。如果数据之间的比较操作非常耗时,不管数据量大小,都推荐使用二分查找,因为哪怕少比较一次,都可以节省很多时间。比如,数组中存储的是长度超过 300 的字符串,如此长的两个字符串之间比较大小,就会非常耗时。我们需要尽可能地减少比较次数,而比较次数的减少会大大提高性能,这个时候二分查找就比顺序遍历更有优势。

 

4. 数据量太大不适合二分查找

二分查找需要依赖数组这种数据结构,而数组为了支持随机访问的特性,要求内存空间连续,对内存的要求比较苛刻。比如,有 1GB 大小的数据,如果希望用数组来存储,那就需要 1GB 的连续内存空间。也就是说,即便有 2GB 的内存空间剩余,但是如果这剩余的 2GB 内存空间都是零散的,没有连续的 1GB 大小的内存空间,那照样无法申请一个 1GB 大小的数组。

所以,太大的数据用数组存储比较吃力,没有数组也就不能用二分查找了。

 

标签:二分,arr,mid,算法,查找,low,数组
From: https://www.cnblogs.com/luwei0424/p/17781319.html

相关文章

  • 智慧矿山:AI算法能有效识别你是否未穿戴安全带!
    未穿戴安全带识别AI算法,作为智慧矿山的重要应用之一,不仅可以有效提高矿山工作人员的安全意识,还可以降低事故发生的概率。然而,识别准确率的提高一直是该算法面临的挑战之一。为了解决这个问题,研究人员不断努力探索新的方法和技术。目前,提高未穿戴安全带识别AI算法的准确率可以通过以......
  • 文心一言 VS 讯飞星火 VS chatgpt (118)-- 算法导论10.3 3题
    三、用go语言,在ALLOCATE-OBJECT和FREE-OBJECT过程的实现中,为什么不需要设置或重置对象的prev属性呢?文心一言:在Go语言中,ALLOCATE-OBJECT和FREE-OBJECT过程的实现通常不需要显式地设置或重置对象的prev属性。这是因为在Go语言的内存管理中,对象(或更具体地说,变量)的生命......
  • 深度优先算法
    一、引例提问:输入一个数字n,输出1~n的全排列。首先,将全排列比作小盒子和扑克牌将数字比作扑克牌,我们有1号,2号,3号扑克牌和1号2号3号3个盒子。每个盒子只能放置一个扑克牌,实现全排列。那我们如何往小盒子中放入扑克牌。每个小盒子都可能放1号、2号或者3号扑克牌,这都需要一一尝试,这......
  • 牛牛小数输出的算法
    背景 输入一些内容,要求输出格式为两位随机数。最开始思路:1.读进来字符串,判断是否有'.'2.根据'.'判断是否需要补0或者异常处理3.以'.'为中心分为左右两段,在处理完成后进行拼接  总结:1.python应该用python的思维模式去编程,不应该重复造轮子或用C++的编程思维2.写方法......
  • 查找文件命令find总结以及查找大文件
    find/-name***示例如下:[dinpay@zk-spark-01spark]$find/home/ll-nameslaves/home/ll/spark/conf/slaves查找大于80M的文件find.-typef-size+60M查找并显示属性find.-typef-size+60M-print0|xargs-0ls-l查找并显示具体文件大小find.-typef-size+60M......
  • 算法笔试题:有效的括号字符串,常规栈思路
    题:给定一个只包含三种字符的字符串:(,)和*,写一个函数来检验这个字符串是否为有效字符串。有效字符串具有如下规则:任何左括号(必须有相应的右括号)。任何右括号)必须有相应的左括号(。左括号(必须在对应的右括号之前)。*可以被视为单个右括号),或单个左括号(,或一......
  • 10.22算法
    有效的括号给定一个只包括'(',')','{','}','[',']' 的字符串s,判断字符串是否有效。有效字符串需满足:左括号必须用相同类型的右括号闭合。左括号必须以正确的顺序闭合。每个右括号都有一个对应的相同类型的左括号。 示例1:输入:s="()"输出:true示例 2:输入:s="()[]{}"输出:tru......
  • 内核文档翻译(chatgpt) —— Pathname lookup (路径名查找)
    原文:https://www.kernel.org/doc/html/latest/filesystems/path-lookup.html内核中文件系统相关的文档汇总:FilesystemsintheLinuxkernelThiswrite-upisbasedonthreearticlespublishedatlwn.net:PathnamelookupinLinuxRCU-walk:fasterpathnamelookupinLi......
  • 提高组算法-图论学习笔记
    ##2023-10-21第一节基本概念      一、什么是图:点用边连起来就叫做图,是一种数据结构。二、图的一些定义和概念1、有向图:图的边有方向,只能按箭头方向从一点到另一点。  2、无向图:图的边没有方向,可以双向。3、结点的度:无向......
  • 最小生成树 PRIM算法 - 附可运行代码
    学习的时候,觉得这篇资料蛮好的:https://www.cnblogs.com/JayShao/p/12381830.html 然后这篇文章比较新颖,自觉比较适合写代码的理解:https://www.geeksforgeeks.org/kruskals-minimum-spanning-tree-algorithm-greedy-algo-2/  代码也比较齐全,我自己动手试试吧! Prim:生成......