首页 > 编程语言 >算法学习笔记六一topk问题

算法学习笔记六一topk问题

时间:2023-12-27 15:36:23浏览次数:34  
标签:六一 元素 堆排序 算法 枢轴 sift topk

目录

什么是topk问题

Top-k 问题是指在一个元素集合中找出前 k 个最大或最小的元素。这个问题在很多实际场景中都有应用,例如在大数据处理中获取最大的 k 个元素、搜索引擎中的搜索结果排序等。

解决方法

  1. 堆排序:使用最小堆或最大堆来解决 Top-k 问题是一种常见的方法。初始时,将前 k 个元素构建成一个最小堆或最大堆。然后遍历剩余的元素,如果当前元素比堆顶元素大(或小),则将堆顶元素替换为当前元素,并重新调整堆使其满足堆的性质。最终,堆中的元素就是前 k 个最大(或最小)的元素。

  2. 快速选择算法:快速选择算法是基于快速排序的思想,它可以在平均情况下快速找到第 k 小(或第 k 大)的元素。快速选择算法选择一个枢轴元素,将序列分为两部分,一部分比枢轴元素小,另一部分比枢轴元素大。根据枢轴元素的位置,可以确定第 k 小(或第 k 大)元素在哪个部分中,然后递归地在相应的部分中查找。这样,可以通过不断缩小问题规模来找到前 k 个最大(或最小)的元素。

无论是使用堆排序还是快速选择算法,它们的时间复杂度都是 O(n log k),其中 n 是元素集合的大小。这是因为在找出前 k 个最大(或最小)元素时,需要进行 k 次堆调整或划分操作。这使得这两种方法在处理大规模数据时具有较高的效率。

代码示例(堆排序)

在上一章笔记中已经介绍过堆排序的算法原理,这里直接进行应用。

# 这里sift函数构建的是一个小根堆
def sift(li, low, high):
    i = low
    j = 2 * i + 1
    temp = li[low]
    while j <= high:
        if j + 1 <= high and li[j + 1] < li[j]:
            j += 1
        if li[j] < temp:
            li[i] = li[j]
            i = j
            j = 2 * i + 1
        else:
            break
    li[i] = temp

def heap_sort_top_k(li, k):
    # 取前k个元素
    topk = li[0:k]
    n = len(li)
    # 对前k个元素先建立小根堆
    for i in range((k - 2) // 2, -1, -1):
        sift(topk, i, k - 1)
    # 把原数组剩余元素和堆顶最小元素比较, 把大的数替换堆顶元素
    for i in range(k, n):
        if li[i] > topk[0]:
            topk[0] = li[i]
            sift(topk, 0, k - 1)
    # 对topk数组排序
    for i in range(k - 1, -1, -1):
        topk[i], topk[0] = topk[0], topk[i]
        sift(topk, 0, i - 1)
    return topk

标签:六一,元素,堆排序,算法,枢轴,sift,topk
From: https://www.cnblogs.com/chase-youth/p/17930648.html

相关文章

  • 算法学习笔记六一堆排序
    目录什么是堆排序算法思想代码示例什么是堆排序堆排序(HeapSort)是一种基于二叉堆数据结构的排序算法。它的主要思想是将待排序的序列构建成一个大顶堆(或小顶堆),然后反复从堆顶取出最大(或最小)元素,将剩余的元素重新调整为一个新的堆,再重复取出堆顶元素的过程,直到排序完成。算法思......
  • 人工智能算法原理与代码实战:强化学习的基础概念和实践
    1.背景介绍强化学习(ReinforcementLearning,RL)是一种人工智能(AI)的子领域,它旨在解决如何让智能体(如机器人)在环境中取得最佳性能的问题。强化学习的核心思想是通过与环境的互动来学习,而不是通过传统的监督学习方法。在这种学习过程中,智能体通过试错学习,并根据收到的奖励来调整其行为......
  • 人工智能算法原理与代码实战:自然语言处理与文本生成
    1.背景介绍自然语言处理(NLP)和文本生成是人工智能领域中的两个重要分支。随着大数据、深度学习和自然语言理解技术的发展,NLP和文本生成技术已经取得了显著的进展。这本书将揭示NLP和文本生成算法的原理,并提供详细的代码实例,帮助读者理解和实践这些算法。本书将涵盖以下主题:自然语言......
  • 人工智能算法原理与代码实战:强化学习与智能交互
    1.背景介绍强化学习(ReinforcementLearning,RL)是一种人工智能(ArtificialIntelligence,AI)技术,它通过在环境中进行交互来学习如何做出最佳决策。强化学习的核心思想是通过在环境中进行试错来学习如何做出最佳决策,而不是通过传统的监督学习方法来学习。强化学习的应用范围广泛,包括......
  • 遗传算法在网络优化领域的应用
    1.背景介绍遗传算法(GeneticAlgorithm,GA)是一种基于生物进化过程的优化算法,它通过模拟自然界中的生物进化过程来寻找最优解。遗传算法的核心思想是通过对种群中的个体进行评价、选择、交叉和变异等操作,逐步找到最优解。在网络优化领域,遗传算法广泛应用于各种问题的解决,如路径规划、......
  • 磁盘调度算法、虚拟内存、抖动(颠簸)、堆栈访问速度、内存分配、内存交换、编码(ASCII、U
    常见的几种磁盘调度算法:读写一个磁盘块的时间的影响因素有:......
  • 人工智能大模型原理与应用实战:增强学习算法优化
    1.背景介绍人工智能(ArtificialIntelligence,AI)是一门研究如何让计算机模拟人类智能的学科。在过去的几十年里,人工智能研究的主要重点是规则-基于和知识-基于的系统。然而,随着数据量的增加和计算能力的提高,机器学习(MachineLearning,ML)和深度学习(DeepLearning,DL)技术在人工智能......
  • 人脸识别技术演进:从几何算法到深度学习的深度剖析
    本文全面探讨了人脸识别技术的发展历程、关键方法及其应用任务目标,深入分析了从几何特征到深度学习的技术演进。关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实验室成员,阿里云认证的资深架构师,项目管......
  • 组合优化的奥秘:揭示算法奥妙
    1.背景介绍组合优化是一种常见的优化问题,它涉及到寻找一组变量的最佳组合,以满足某种目标函数的要求。这类问题广泛存在于计算机视觉、自然语言处理、机器学习等领域。在这篇文章中,我们将深入探讨组合优化的核心概念、算法原理和实例代码。组合优化问题通常可以用以下形式表示:$$\be......
  • RapidMiner的机器学习算法解析:一一对比和应用
    1.背景介绍RapidMiner是一个开源的数据科学和机器学习平台,它提供了一系列的数据挖掘和机器学习算法,以及一些工具来帮助数据科学家和分析师更快地构建和部署机器学习模型。在这篇文章中,我们将深入探讨RapidMiner中的机器学习算法,揭示它们的原理、应用和优缺点。2.核心概念与联系在Ra......