首页 > 其他分享 >二分查找的区间到底是开还是闭?

二分查找的区间到底是开还是闭?

时间:2024-11-27 11:34:54浏览次数:4  
标签:二分 right mid 查找 区间 左闭 left

二分查找的区间到底是开还是闭?

在这两个月的时间里,我似乎没有产出任何的有关知识点的文章,大多数都是题解相关的内容。以至于许多人觉得 Macw07 “失踪”了。本文是我来到北美之后的第一篇知识点文章,请大家多多关照。

这次不讲难的知识点了,讲一个大家都熟悉的,但又非常令人抓毛的算法:二分查找和二分答案算法

引言 Introduction

注意:本文仅针对了解过二分查找基本算法原理的用户群体,若您从未接触过或了解过该算法,请先学习基础的二分查找算法。

二分查找算法是大家一个再熟悉不过的算法了,二分查找算法可以在一个 有序数列 中高效地查找某个或多个特定的目标值。一般来说,二分查找的时间复杂度在 \(O(\log_2 N))\) 级别。二分算法非常适合在大数据集上实现快速查询。与此同时,除了基本的二分查找算法,它的许多变种也被广泛应用于各种场景,比如求最大值、最小值,甚至在复杂的数据结构中优化数据的查找性能。

许多同学肯定在学习完基本的二分查找后一直有一个疑问:我到底该如何设置 \(L\) 和 \(R\) 的区间闭合状态?什么时候需要输出 \(L\) 或 \(R\),为什么有时候还需要 \(+1\)?\(\text{Mid}\) 到底保存的是什么东西?etc.

事实上,区间开闭的变量定义 确实是一个核心且容易混淆的问题,在 CSP 考试中也常考此知识点,因此本文将重点围绕区间开闭的变量定义来展开。

在深入讨论区间开闭之前,有必要回顾一下二分查找的基本原理。二分查找通过反复将搜索区间分成两半,逐步缩小目标值所在的范围,直到找到目标值或确定其不存在。具体步骤如下:

  1. 初始化:设定搜索区间的左右边界 \(L\) 和 \(R\)。

  2. 计算中点:计算中点 \(M = L + \dfrac{R - L}{2}\)。

  3. 比较

    :将目标值与中点元素进行比较。

    • 若相等,返回中点位置。
    • 若目标值小于中点元素,缩小搜索区间至左半部分。
    • 若目标值大于中点元素,缩小搜索区间至右半部分。
  4. 重复:重复上述步骤,直到找到目标值或搜索区间为空。

开区间/闭区间 Open Interval/Closed Interval

在文章开始,先了解一下区间的开闭性。

开区间

定义:开区间表示区间的端点 不包含在区间内,用小括号 \(()\) 表示。

示例:\((2, 5)\) 表示所有介于 \(2\) 和 \(5\) 之间的数,但不包含数字 \(2\) 和 \(5\)。

闭区间

定义:开区间表示区间的端点 包含在区间内,用方括号 \([]\) 表示。

示例:\([2, 5]\) 表示所有介于 \(2\) 和 \(5\) 之间的数,而且包含数字 \(2\) 和 \(5\)。

半开区间/半闭区间

定义:半开区间或半闭区间表示区间的一个端点包含在内,另一个端点不包含在内。

示例:\((2, 5]\) 表示所有介于 \(2\) 和 \(5\) 之间的数,且包含数字 \(5\),但不包含数字 \(2\)。

区间类型 表示方式 是否包含左端点 \(a\) 是否包含右端点 \(b\)
开区间 \((a, b)\)
闭区间 \([a, b]\)
左开右闭 \((a, b]\)
左闭右开 \([a, b)\)

区间开闭的类型 Interval Categories

在实现二分查找的时候,区间的定义是最常见的一个问题,你可能会看到过以下不同的区间开闭性的定义:

  1. 左开右开 \((\text{left}, \text{right})\)
  2. 左闭右闭 \([\text{left}, \text{right}]\)
  3. 左开右闭 \((\text{left}, \text{right}]\)
  4. 左闭右开 \([\text{left}, \text{right})\)

通常来说,我们一般会选择【左闭右开】或者【左闭右闭】的区间定义,所以本文也就着重围绕这两个部分讲解。但对于不同的定义区间,如果稍有不慎,就容易使代码进入 死循环

左闭右闭区间

定义:搜索区间包括 leftright,即 leftright 都可能是目标值。

退出条件left > right,表示搜索区间为空。

左闭右闭区间的二分查找的常见写法如下:

while (left <= right) { // 注意是 <=
    int mid = left + (right - left) / 2;
    if (nums[mid] == target) {
        return mid;
    } else if (nums[mid] < target) {
        left = mid + 1; // [mid+1, right]
    } else {
        right = mid - 1; // [left, mid-1]
    }
}

左闭右开区间

定义:搜索区间包括 left 但不包括 right,即目标值可能是 left,但不可能是 right

退出条件:当 left == right 时,表示搜索区间为空。

左闭右开区间的二分查找的常见写法如下:

while (left < right) { // 注意是 <
    int mid = left + (right - left) / 2;
    if (nums[mid] == target) {
        return mid;
    } else if (nums[mid] < target) {
        left = mid + 1; // [mid+1, right)
    } else {
        right = mid; // [left, mid)
    }
}

两种区间的迭代过程中的差异 Differences During Iterating

left 的更新:

  • 左闭右闭left = mid + 1,因为 mid 已经被检查过了,mid+1 开始的新区间仍是闭区间。
  • 左闭右开left = mid + 1,保持 right 的开区间性质。

right 的更新:

  • 左闭右闭right = mid - 1,因为 mid 已经被检查过了,mid-1 保证了闭区间不重复。
  • 左闭右开right = mid,将 mid 排除,保证开区间不包含 right

退出条件:

  • 左闭右闭:循环结束条件为 left > right
  • 左闭右开:循环结束条件为 left == right

两种区间的优缺点 Pros & Cons

左闭右闭的有点

  1. 直观易懂:包括 leftright 的写法更加接近自然语言的描述,例如 “在 \([left, right]\) 区间查找目标值”。
  2. 处理小区间:对于某些需要特别处理的小区间问题,左闭右闭可以更容易描述逻辑。

左开右闭的优点

避免数组越界:使用左闭右开区间,right 永远是无效位置,不会直接访问数组越界的索引。

逻辑一致性:左闭右开区间的范围在迭代过程中可以稳定保持逻辑清晰,容易与数学符号对应。

代码简洁:由于退出条件是 left == right,很多情况下可以直接用 left 返回结果,无需做出额外检查。

实际应用中的选择 Choosing the Right Interval in Practice

在实际应用中,选择使用左闭右闭还是左闭右开区间,往往取决于具体问题的需求和个人习惯。以下是一些指导原则:

  1. 数组索引:在处理数组索引时,左闭右开区间更加自然,因为数组的索引从 0n-1,左闭右开可以避免 n 的无效访问。
  2. 范围划分:当需要频繁划分范围时,左闭右开区间的逻辑更清晰,减少了混淆和错误。
  3. 边界条件:如果问题中涉及到明确的边界条件,如查找第一个或最后一个满足条件的元素,选择合适的区间类型可以简化逻辑。

典型例题分析 Exemplars

1. 在数组中查找目标值,返回索引

左闭右闭实现:

int binarySearch(vector<int>& nums, int target) {
    int left = 0, right = nums.size() - 1;
    while (left <= right) {
        int mid = left + (right - left) / 2;
        if (nums[mid] == target) {
            return mid;
        } else if (nums[mid] < target) {
            left = mid + 1;
        } else {
            right = mid - 1;
        }
    }
    return -1;
}

左闭右开实现:

int binarySearch(vector<int>& nums, int target) {
    int left = 0, right = nums.size();
    while (left < right) {
        int mid = left + (right - left) / 2;
        if (nums[mid] == target) {
            return mid;
        } else if (nums[mid] < target) {
            left = mid + 1;
        } else {
            right = mid;
        }
    }
    return -1;
}

2. 在有序数组中找到目标值的插入位置

综上所述,左闭右开更适合这一场景,因为它的区间逻辑更加贴合“边界”问题:

int searchInsert(vector<int>& nums, int target) {
    int left = 0, right = nums.size();
    while (left < right) {
        int mid = left + (right - left) / 2;
        if (nums[mid] < target) {
            left = mid + 1;
        } else {
            right = mid;
        }
    }
    return left; // 返回插入位置
}

复杂度分析 Complexity Analysis

二分查找的时间复杂度为 \(O(\log_2 N)\),空间复杂度为 \(O(1)\)。这种高效性使得二分查找在处理大规模数据时表现出色。然而,二分查找的前提条件是数据必须是有序的,这在某些情况下可能需要额外的排序时间。

相关题目 Practice Problems

可以在阅读本文后自己实践一下以下题目:

  1. 查找最接近的元素 在一个升序序列中,查找与给定值最接近的元素。
  2. 二分法求函数的零点 已知函数在某区间内有且只有一个根,使用二分法求出该根。
  3. 查找 x 给定一个升序序列(元素均不重复),在该序列中查找指定的值,若存在则输出对应的下标,否则输出 \(-1\)。
  4. 二分查找 在 \(N\) 个从小到大排列且不重复的整数中,快速找到指定的数字 \(t\),若找不到则输出 \(-1\)。

标签:二分,right,mid,查找,区间,左闭,left
From: https://www.cnblogs.com/Macw07/p/18572027

相关文章

  • 二分查找2
    //1111111111.cpp:此文件包含"main"函数。程序执行将在此处开始并结束。///*http://oj.daimayuan.top/course/16/problem/60给一个序列a1,a2,…,an和m个询问。每次询问给出两个数l,x,求最大的r(r≤n)满足al+al+1+⋯+ar≤x。如果不存在这样的r,即al>x,输出......
  • 算法练习:34. 在排序数组中查找元素的第一个和最后一个位置
    题目链接:34.在排序数组中查找元素的第一个和最后一个位置。在这里我们可以用暴力的解法:就是一次判断,第一次遇见的元素==target,和最后一次遇见的,就保存起来但是这样暴力解法时间复杂度为O(N)。时间复杂度超出了题目意思。优化解法:因为数组是有序的,我们可以根据二分查找思想......
  • 质因数分解+状态压缩求区间积
    例题https://www.luogu.com.cn/problem/P10724#include<bits/stdc++.h>#defineendl'\n'#definelowbit(x)(x&-x)usingnamespacestd;typedeflonglongll;typedefpair<int,int>pii;typedefpair<ll,ll>pll;constdoublepi=ac......
  • ABAP开发学习——二分法查找问题记录
    在ABAP中使用二分法查找之前需要注意内表需要提前经过排序,尤其注意根据哪个字段使用BINARYSEARCH,就要针对哪个字段进行排序。使用两个及以上字段更要注意这一点,不可以用AB排序,再用BC去二分法查找,这样通常是读不到所需数据的。TYPES:BEGINOFty_data,field1TYP......
  • 查找相关知识点
    一.基本概念1.查找:在数据集合中寻找满足条件的数据元素2.查找表:用于查找的数据结合称之为查找表3.静态查找表(StaticSearchTable):只作查找操作的查找表。主要操作查询某个“特定的”数据元素是否在查找表中。检索某个“特定的”数据元素和各种属性。4.动态查找表(Dy......
  • C++ 1112 超标区间 (乙级)
    上图是用某科学研究中采集的数据绘制成的折线图,其中红色横线表示正常数据的阈值(在此图阈值是25)。你的任务就是把超出阈值的非正常数据所在的区间找出来。例如上图中横轴[3,5]区间中的3个数据点超标,横轴上点9(可以表示为区间[9,9])对应的数据点也超标。输入格式:输......
  • 整体二分做题记录
    0.前言1.5年前学过,没学好,回来加训。I.P3834【模板】可持久化线段树2板子题。时间复杂度\(\mathcal{O(n\log^2n)}\)。把\(\{a_i\}\)看作修改和后面的询问放一起,每次二分出答案值域上的\(mid\)后,如果修改的值\(\lemid\),那么BIT在\(i\)这个点上加\(1\);如果是询问......
  • 查找指定的文件:find、locate、which、whereis
    Linux上查看某个文件的几种方式:1、findfind命令找某个文件的方式,可以指定路径,如指定路基下查找"src.h"#在/usr/include-name目录下搜索src.h文件find/usr/include-name"src.h"#在根目录下搜索src.h文件,忽略错误信息,如没有权限访问的位置find/-name"src.h"......
  • 算法沉淀三:二分查找
    目录二分介绍 题目练习1.二分查找2.在排序数组中查找元素的第一个和最后一个位置3.搜索插入位置4.x的平方根5.山峰数组的峰顶6.寻找峰值7.搜索旋转排序数组中的最小值8.0~n-1中缺失的数字《剑指Offer53》 二分介绍 什么是二分查找?二分查找(BinarySearch),也......
  • 梧桐数据库之查找至少有3名直接下属的经理
    一、背景说明假设在一个公司内部有多个部门,每个部门由经理和员工组成。为了更好地管理和优化组织结构,公司希望找出那些直接管理至少3名员工的经理。这些经理通常承担更多的管理职责,并且对公司运营具有更大的影响力。通过分析这些经理及其下属,公司可以更好地理解组织结构,进行人力......