离散化(Discretization Algorithm)

时间：2024-02-06 22:12:00浏览次数：36

标签：begin map Discretization end Algorithm int mid 离散

简介

离散化 —— 把无限空间中有限的个体映射到有限的空间中去，以此提高算法的时空效率，即：在不改变数据相对大小的条件下，对数据进行相应的缩小。
离散化本质上可以看成是一种 \(哈希\)，其保证数据在哈希以后仍然保持原来的全/偏序关系。

描述

离散化用于处理一些个数不多，但是数据本身很大但是仍需要作为数组等无法过大的下标时，我们可以处理一下这些大的下标，并且依然保持其原序。
通俗地讲就是当有些数据因为本身很大或者类型不支持，自身无法作为数组的下标来方便地处理，而影响最终结果的只有元素之间的相对大小关系时，我们可以将原来的数据按照从大到小编号来处理问题。

示例

示例图片

提示

注意去重复元素
快速保序映射

代码

完成排序操作:

sort(a.begin(), a.end());

完成去重操作：

a.erase(unique(a.begin(), a.end()), a.end());

完成查找：
1 . 使用 std::lower_bound 函数查找离散化之后的排名（即新编号）：
lower_bound(a + 1, a + len + 1, x) - a; // 查询 x 离散化后对应的编号
2 . 二分查找：
```
int find(int x) {
	int l = 0 , r = a.size() -1;
	while (l < r) {
    	int mid = l + r >> 1;
    	if (a[mid] >= x) r = mid;
    	else l = mid + 1;
	}
	return l + 1;	// 从1 ~ n的映射。
}
```

应用

区间和

假定有一个无限长的数轴，数轴上每个坐标上的数都是 \(0\) 现在，我们首先进行 \(n\) 次操作，每次操作将某一位置 \(x\) 上的数加 \(c\)。接下来，进行 \(m\) 次询问，每个询问包含两个整数 \(l\) 和 \(r\) ，你需要求出在区间 \([l,r]\) 之间的所有数的和。

分析：
- 由于坐标数据范围很大，但是数据量较小，考虑离散化处理所有坐标
- 最后要求区间和，可以使用前缀和来求
题解

#include <iostream>
#include <cstring>
#include <algorithm>
using namespace std;
typedef pair<int, int> P;
const int N = 3e5 + 10;
int n, m;
int a[N]; //用于前缀和计算
vector<P> add, query;  //用于存储输入
vector<int> all;  //用于存储所有目标下标
/**
 * 二分查找
 * @param x target
 * @return 从1 ~ n的映射，返回值需要加1
 */
int find(int x) {
    int l = 0, r = all.size() - 1;
    while (l < r) {
        int mid = l + r >> 1;
        if (all[mid] >= x) r = mid;
        else l = mid + 1;
    }
    return l + 1;
}
int main() {
    scanf("%d%d", &n, &m);
    for (int i = 0; i < n; i++) {
        int a, b;
        scanf("%d%d", &a, &b);
        add.push_back({a, b});
        all.push_back(a);  // 将有用的下标全部存入all
    }
    for (int i = 0; i < m; i ++ ) {
        int a, b;
        scanf("%d%d", &a, &b);
        query.push_back({a, b});

        all.push_back(a);
        all.push_back(b);
    }
    //排序
    sort(all.begin(), all.end());
    //去重
    all.erase(unique(all.begin(), all.end()), all.end());
    //插入数据
    for (auto &item: add) {
        a[find(item.first)] += item.second; //映射
    }
    //预处理前缀和
    for (int i = 1; i <= all.size(); i++) a[i] += a[i - 1]; //前缀和
    //查询
    for (auto &item: query) {
      cout << a[find(item.second)] - a[find(item.first) - 1] << endl;
    }
    return 0;
}

补充

对 \(vector\) 进行离散化：

vector<int> a, b;  // b 是 a 的一个副本
sort(a.begin(), a.end());
a.erase(unique(a.begin(), a.end()), a.end());
for (int i = 0; i < n; ++i)
     b[i] = lower_bound(a.begin(), a.end(), b[i]) - a.begin();

\(map\) 映射进行离散化：
- 可以用 \(map\) （每次在 \(map\) 中查询一下这个值是否存在，如果存在则返回对应的值，否则对应另一个值）或 \(hash\) 表（即 unordered_map 或手写 \(hash\) 表，运用方式和 \(map\) 相同）。

\(map\) 与 unordered_map 的区别

对于 \(map\) 的底层原理，是通过红黑树（一种非严格意义上的平衡二叉树）来实现的，因此 \(map\) 内部所有的数据都是有序的（默认按 \(key\) 进行升序排序）
unordered_map 和 \(map\) 类似，都是存储的 \(key - value\)的值，可以通过 \(key\) 快速索引到 \(value\) 。不同的是 unordered_map 不会根据 \(key\) 的大小进行排序，存储时是根据 \(key\) 的 \(hash\) 值判断元素是否相同，即 unordered_map 内部元素是无序的。unordered_map的底层是一个防冗余的哈希表（开链法避免地址冲突）

查询、插入、删除操作的时间复杂度都是 \(O(logn)\)

标签：begin,map,Discretization,end,Algorithm,int,mid,离散
From： https://www.cnblogs.com/BadBadBad/p/18010363/DiscretizationAlgorithm

基础算法（十四）离散化+二分 ---以题为例
假定有一个无限长的数轴，数轴上每个坐标上的数都是 0。现在，我们首先进行 n 次操作，每次操作将某一位置 x 上的数加 c。接下来，进行 m 次询问，每个询问包含两个整数 l 和 r，你需要求出在区间 [l,r] 之间的所有数的和。输入格式第一行包含两个整数 n 和 m。接下来 ......
【阅读笔记】《A New Hardware-Efficient Algorithm and Reconfigurable Architecture
一、对比度增强算法AGCWD硬件化实现2013年发表在TIP上的对比度增强算法AGCWD（Efficientcontrastenhancementusingadaptivegammacorrectionwithweightingdistribution）2014年发表在IEEETransactionsonImageProcessing的《ANewHardware-EfficientAlgorithmandReco......
【离散数学】第一章命题逻辑
第一章命题逻辑真值"地球是行星"这句话（命题）是正确的，我们称它的真值为真，通常记作T或者1；这句话也被称作真命题。"2是无理数"这句话（命题）是错误的的，我们称它的真值为假，通常记作F或者0；这句话也被称作假命题。1.命题的真值一定是唯一的；如果一句话不确定真假或者有时候真有时候假，那这句话......
遗传算法(Genetic Algorithm)
算法简介遗传算法（GeneticAlgorithm，GA）是一种基于自然选择和遗传操作的随机全局搜索优化算法。它通过模拟自然选择和遗传中发生的复制、交叉(crossover)和变异(mutation)等现象，从任一初始种群（父代）开始，通过随机选择、交叉和变异操作，产生更具有生存优势的子代，使群体不断向搜索空间最......
补充：基于项目的协同过滤推荐算法(Item-Based Collaborative Filtering Recommendation
前言继续上篇博客，继续读论文。想看上篇论文的同学可以点击这里相关工作Inthissectionwebrieflypresentsomeoftheresearchliteraturerelatedtocollaborativefiltering,recommendersystems,dataminingandpersonalization.在本节中，我们简要介绍了一些与协同......
R语言中的模拟过程和离散化：泊松过程和维纳过程
全文链接：http://tecdat.cn/?p=17303 原文出处：拓端数据部落公众号本文中，我们讨论了一个将Poisson过程与Wiener过程结合在一起的最佳算法的问题。实际上，为了生成泊松过程，我们总是习惯于模拟跳跃之间的持续时间。我们使用给定时间间隔内跳跃的均匀性，该条件取决于跳跃的次数。首先......
离散化
关于离散化的那些事离散化，本质上就是一种hash，我们需要用到的只是数据的排名而不是数据本身，通过映射的方法把跨度大又疏松的数据转化为跨度小的数据。离散化一般有两种形式，一种是sort+unique，另一种是map。sort+unique首先就是直接用数组排序后去重，将需要用的所有数塞到一个......
离散数学第1章数理逻辑
1.1命题1.1.1基本概念断言：一个陈述语句。祈使句、疑问句一定不是断言。命题：要么为真，要么为假，不能二者都是的断言。原子命题(本源命题)：一个命题已不能分解成更简单的命题命题和本源命题常用大写字母P、Q、R表示eg.P:4是质数1.1.2命题联结词复合命题：命题和原子命题可通过......
基于项目的协同过滤推荐算法(Item-Based Collaborative Filtering Recommendation Alg
前言协同过滤推荐系统，包括基于用户的、基于项目的息肉通过率等，今天我们读一篇基于项目的协同过滤算法的论文。今天读的论文为一篇名叫《基于项目的协同过滤推荐算法》(Item-BasedCollaborativeFilteringRecommendationAlgorithms)。摘要Recommendersystemsapplyknowledg......
GYM102596L Yosupo's Algorithm【分治，支配对】
给定平面上\(2n\)个点，每个点有坐标\((x_i,y_i)\)，权值\(w_i\)及颜色\(c_i\)。所有点满足：若\(c_i=0\)，则\(x_i<0\)；若\(c_i=1\)，则\(x_i>0\)。\(q\)次查询，每次给定\(L_i,R_i\)，你需要选择两个点\(i,j\)满足如下条件：\(c_i=0,c_j=1\)。\(x_i<L,x_j>R\)或\(x_......

离散化(Discretization Algorithm)

简介

描述

示例

提示

代码

应用

区间和

补充

\(map\) 与 unordered_map 的区别

相关文章

赞助商

阅读排行