首页 > 编程语言 >排序算法之桶排序

排序算法之桶排序

时间:2024-08-12 19:54:22浏览次数:9  
标签:复杂度 元素 合并 算法 num 之桶 排序 数据


title: 桶排序
date: 2024-7-25 18:58:19 +0800
categories:

  • 排序算法
    tags:
  • 排序
  • 算法
  • 桶排序
    description: 桶排序(bucket sort)是分治策略的一个典型应用。它通过设置一些具有大小顺序的桶,每个桶对应一个数据范围,将数据平均分配到各个桶中;然后,在每个桶内部分别执行排序;最终按照桶的顺序将所有数据合并。
    math: true

桶排序

桶排序(Bucket Sort)是一种基于分配的排序算法。它将元素分散到不同的桶中,然后对每个桶分别进行排序,最后将桶中的元素合并起来。

桶排序的原理

桶排序适用于均匀分布在一定范围内的数值。其主要思想是:

  1. 创建若干桶:将要排序的数据分到若干个桶中。
  2. 对每个桶内的数据进行排序:桶内的排序可以使用任意排序算法。
  3. 合并所有桶中的数据:将排好序的桶中的数据合并,得到最终的有序数据。

桶排序的步骤

  1. 创建桶:根据数据范围和桶的数量,创建若干个桶。
  2. 分配数据:将数据分配到对应的桶中。
  3. 桶内排序:对每个桶中的数据进行排序。
  4. 合并数据:将所有桶中的数据按顺序合并,得到排序后的结果。

图示

桶排序

示例

以下是一个桶排序的示例,假设我们有一个浮点数数组:[0.42, 0.32, 0.23, 0.52, 0.25, 0.47, 0.51]。

第一步:创建桶

假设我们创建10个桶,每个桶对应范围是[0, 0.1),[0.1, 0.2),[0.2, 0.3)等。

第二步:分配数据

将每个数据分配到对应的桶中:

  • 0.42 -> 桶4
  • 0.32 -> 桶3
  • 0.23 -> 桶2
  • 0.52 -> 桶5
  • 0.25 -> 桶2
  • 0.47 -> 桶4
  • 0.51 -> 桶5

第三步:桶内排序

对每个桶中的数据进行排序:

  • 桶2: [0.23, 0.25]
  • 桶3: [0.32]
  • 桶4: [0.42, 0.47]
  • 桶5: [0.51, 0.52]

第四步:合并数据

将所有桶中的数据合并:[0.23, 0.25, 0.32, 0.42, 0.47, 0.51, 0.52]

复杂度分析

桶排序适用于处理体量很大的数据。例如,输入数据包含 100 万个元素,由于空间限制,系统内存无法一次性加载所有数据。此时,可以将数据分成 1000 个桶,然后分别对每个桶进行排序,最后将结果合并。

  • 时间复杂度为 O ( n + k ) O(n + k) O(n+k) :假设元素在各个桶内平均分布,那么每个桶内的元素数量为 n k \frac{n}{k} kn​ 。假设排序单个桶使用 O ( n k log ⁡ n k ) O(\frac{n}{k} \log\frac{n}{k}) O(kn​logkn​) 时间,则排序所有桶使用 O ( n log ⁡ n k ) O(n \log\frac{n}{k}) O(nlogkn​) 时间。当桶数量 k k k 比较大时,时间复杂度则趋向于 O ( n ) O(n) O(n) 。合并结果时需要遍历所有桶和元素,花费 O ( n + k ) O(n + k) O(n+k) 时间。
  • 自适应排序:在最差情况下,所有数据被分配到一个桶中,且排序该桶使用 O ( n 2 ) O(n^2) O(n2) 时间。
  • 空间复杂度为 O ( n + k ) O(n + k) O(n+k)、非原地排序:需要借助 k k k 个桶和总共 n n n 个元素的额外空间。
  • 桶排序是否稳定取决于排序桶内元素的算法是否稳定。

时间复杂度

  • 最佳情况: O ( n ) O(n) O(n)。
  • 最坏情况: O ( n 2 ) O(n^2) O(n2)。
  • 平均情况: O ( n + k ) O(n+k) O(n+k)。

空间复杂度

  • 空间复杂度: O ( n ⋅ k ) O(n \cdot k) O(n⋅k)

如何实现平均分配

桶排序的时间复杂度理论上可以达到 O ( n ) O(n) O(n) ,关键在于将元素均匀分配到各个桶中,因为实际数据往往不是均匀分布的。若将区间平均划分为 10 个,各个桶中的数据的数量差距会非常大。

为实现平均分配,我们可以先设定一条大致的分界线,将数据粗略地分到 3 个桶中。分配完毕后,再将数据较多的桶继续划分为 3 个桶,直至所有桶中的元素数量大致相等

平均分配
这种方法本质上是创建一棵递归树,目标是让叶节点的值尽可能平均。当然,不一定要每轮将数据划分为 3 个桶,具体划分方式可根据数据特点灵活选择。

如果我们提前知道数据的概率分布,则可以根据数据概率分布设置每个桶的价格分界线。值得注意的是,数据分布并不一定需要特意统计,也可以根据数据特点采用某种概率模型进行近似。

概率分配

Java代码实现

/* 桶排序 */
void bucketSort(float[] nums) {
    // 初始化 k = n/2 个桶,预期向每个桶分配 2 个元素
    int k = nums.length / 2;
    List<List<Float>> buckets = new ArrayList<>();
    for (int i = 0; i < k; i++) {
        buckets.add(new ArrayList<>());
    }
    // 1. 将数组元素分配到各个桶中
    for (float num : nums) {
        // 输入数据范围为 [0, 1),使用 num * k 映射到索引范围 [0, k-1]
        int i = (int) (num * k);
        // 将 num 添加进桶 i
        buckets.get(i).add(num);
    }
    // 2. 对各个桶执行排序
    for (List<Float> bucket : buckets) {
        // 使用内置排序函数,也可以替换成其他排序算法
        Collections.sort(bucket);
    }
    // 3. 遍历桶合并结果
    int i = 0;
    for (List<Float> bucket : buckets) {
        for (float num : bucket) {
            nums[i++] = num;
        }
    }
}

标签:复杂度,元素,合并,算法,num,之桶,排序,数据
From: https://blog.csdn.net/rd_w_csdn/article/details/141139767

相关文章

  • 排序算法之归并排序
    title:归并排序date:2024-7-1915:03:06+0800categories:排序算法tags:排序算法归并排序description:归并排序(MergeSort)是一种基于分治法的有效排序算法。它将一个列表分成较小的子列表,对每个子列表进行排序,然后合并这些子列表以产生一个有序列表。math:true......
  • NDT算法详解与C++实现
    点云匹配在感知环节是一个很重要的信息获取手段,而其中的算法也有几个比较经典了,例如ICP(IterativeClosestPoint,迭代最近点)算法,而本文决定记录学习的是NDT算法,也就是NormalDistributionTransform,正态分布变换算法。什么是正态分布变换算法呢,简言之,就是把空间中的点云进行整......
  • 怎样在 SQL 中对一个包含销售数据的表按照销售额进行降序排序?
    在当今数字化商业的浪潮中,数据就是企业的宝贵资产。对于销售数据的有效管理和分析,能够为企业的决策提供关键的支持。而在SQL中,对销售数据按照销售额进行降序排序,是一项基础但极其重要的操作。想象一下,您面前有一张庞大的销售数据表,其中记录了各种产品在不同时间、不同地......
  • 2024华为OD笔试机试 - 模拟目录管理功能 (python/c++/java D卷C卷真题算法)
    华为OD机试(C卷+D卷)2024真题目录(Java&c++&python)题目描述实现一个模拟目录管理功能的软件,输入一个命令序列,输出最后一条命令运行结果。支持命令:创建目录命令:mkdir目录名称,如mkdirabc为在当前目录创建abc目录,如果已存在同名目录则不执行任何操作。此命令无输出......
  • 6-61 顺序表基本运算算法的实现
    线性表实验一实现顺序表各种基本运算的算法目的:领会顺序表存储结构和掌握顺序表中各种基本运算算法设计。内容:编写程序,实现顺序表的各种基本运算算法(假设顺序表的元素类型ElemType为char),并在此基础上设计一个主程序,完成如下功能:(1)初始化顺序表L。(2)依次插入a、b......
  • 「代码随想录算法训练营」第三十五天 | 动态规划 part8
    121.买卖股票的最佳时机题目链接:https://leetcode.cn/problems/best-time-to-buy-and-sell-stock/文章讲解:https://programmercarl.com/0121.买卖股票的最佳时机.html题目难度:简单视频讲解:https://www.bilibili.com/video/BV1Xe4y1u77q题目状态:有一半的思路思路一:贪心对......
  • 足球比赛结果预测系统:遗传算法的研究
    引言最近有个朋友时运不济,自己胡乱玩被足球预测的推子骗了一回又一回,明明我就是专门做足球预测的,偏偏不信我还赌气说自己有本事一个人也能成,现在隔得跟个小怨妇似得,觍着脸回来找我要我传他心得,没办法,好歹十几年的兄弟,他再怎么发病也只能原谅他了,于是就有了这篇文章。不过足球......
  • 【算法学习】排序算法汇总
    冒泡排序1、冒泡排序简介冒泡排序的英文BubbleSort,是一种最基础的交换排序。之所以叫做冒泡排序,因为每一个元素都可以像小气泡一样,根据自身大小一点一点向数组的一侧移动冒泡排序的原理:冒泡轮数:每一轮只能将该轮中最大的数排至最后面。即第一轮只能确定将末位上的数归位......
  • 【算法学习】算法时间复杂度
    时间复杂度的计算时间复杂度简单计算(一层、两层、多层循环)相当于轨迹追踪法:设执行次数为k,按照循环条件阿布算法课学习链接01区别算法(Algorithm)和程序(Program)算法程序设计阶段实施阶段相关领域知识程序员任何语言、伪代码编程语言独立于硬件......
  • [算法] 2-SAT简记
    真的是简记2-SAT$2-SAT$用于求解一个变量只有两种情况的适应性问题(就是有没有解以及输出一种方案);其实可以类比二分图最大匹配(但其实两者的差别还是很大的);算法流程对于每一个变量,我们都有两种情况,$true$和$false$;而题目中给我们的,是形如{$A=true/false$或......