定义：

把无穷大集合中的若干个元素映射为有限集合以便于统计的方法。当数据之间差值很大，即使排完序后，两个数之间仍有很大的差值，不适合直接用下标表示，这样会导致数组开的过大，容量不够，且中间有很多空没有用。针对这种情况，就想到把这间距很大的 m 个数据，在映射到 [1-m] 上，这样就会有效的减少数组的大小，且中间不会有浪费的空间。即把稀疏的数据变的稠密起来。

步骤:

用数组将所有数据存储在一起all[]
对数组all[]进行排序
在开一个数组un[]将排好序的all[]去重并添加到un[]中

此时un[]下标即对应原来数据的离散值。

注意：

查找时可以用二分吗查找（也可以用内置函数lower_bound)

1 //使用库函数
2     int find(int x){
3         return lower_bound(uni+1,uni+1+k,x)-uni;
4     }

 1 //也可以直接二分
 2     int find(int x){
 3         int l=1,r=k+1;
 4         while(l<r){
 5             int mid=(l+r)/2;
 6             if(uni[mid]>=x) r=mid;
 7             else l=mid+1;
 8         }
 9         return r;
10     }

例题

acwing103. 电影、

题目链接

 1 #include<iostream>
 2 #include<algorithm>
 3 #include<cstdio>
 4 
 5 using namespace std;
 6 
 7 const int N = 2e5 + 100;
 8 int a[N], b[N], c[N]; //科学家， 电影语言， 电影字幕
 9 int n, m;
10 int all[3 * N], un[3 * N]; //全部语言， 去重后的语言
11 int cnt;//计数
12 int ans[3 * N];
13 int t;
14 int find(int x) {
15     return lower_bound(un + 1, un + t + 1, x) - un;
16 }
17 
18 int main() {
19     cin >> n;
20     for (int i = 1; i <= n; i ++) {
21         cin >> a[i];
22         all[++cnt] = a[i];
23     }
24 
25     cin >> m;
26 
27     for (int i = 1; i <= m; i ++) {
28         cin >> b[i];
29         all[++cnt] = b[i];
30     }
31 
32     for (int i = 1; i <= m; i ++) {
33         cin >> c[i];
34         all[++cnt] = c[i];
35     }
36 
37     sort(all + 1, all + 1 + cnt);
38     for (int i = 1; i <= cnt; i ++) { //去重并离散化
39         if (i == 1 || all[i] != all[i - 1]) un[++t] = all[i];
40     }
41 
42     int ans1, ans2, ans3;
43     ans1 = ans2 = ans3 = 0;
44 
45     for (int i = 1; i <= n; i ++) { //统计科学家会的语言分类个数
46         ans[find(a[i])] ++;
47     }
48 
49     for (int i = 1; i <= m; i ++) {
50         int anx = ans[find(b[i])], any = ans[find(c[i])];
51         if (anx > ans2 || (anx == ans2 && any > ans3)) {
52             ans1 = i, ans2 = anx, ans3 = any;
53         }
54     }
55 
56     if (ans1 == 0) puts("1");
57     else cout << ans1 << endl;
58 
59     return 0;
60 }

标签：cnt,int,离散,un,数组,include,数据,find
From： https://www.cnblogs.com/msluli/p/16755291.html

Springboot 之 Mybatis-plus 多数据源
简介Mybatis-puls多数据源的使用，采用的是官方提供的dynamic-datasource-spring-boot-starter包的@DS注解，具体可以参考官网：https://gitee.com/baomidou/dynamic-dataso......
SAP UI5 应用元数据文件 manifest.json 的加载和解析原理讲解试读版
一套适合SAPUI5初学者循序渐进的学习教程本专栏计划的文章数在300篇左右，到2022年9月22日为止，目前已经更新了133篇，专栏完成度为......
将容器中（数组、集合）的数据串成字符串
开发工具VC7(VS2002)核心代码用到MFC，测试代码用到stl本代码功能，将容器中（数组、集合）的数据串成字符串核心代码和扩展代码往往不是一个人完成的。扩展代码和使用也很可能......
导入演示数据
导入一下准备好的文件注意：路径中不要有中文！！关于导入的这几张表mysql>showtables;+-----------------------+|Tables_in_bjpowernode|+----------------------......
大数据常用Maven依赖
1<projectxmlns="http://maven.apache.org/POM/4.0.0"xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"2xsi:schemaLocation="http://maven.apache.org/P......
事件相机特征跟踪-概率数据关联法
1、前言在特征跟踪时，有一个重要的概念是数据关联（DataAssociation）。所谓数据关联，可以理解为：哪些数据是由同一个源产生？对于传统图像而言，我们可以计算特征的描述子，进行匹配从......
3D目标检测深度学习方法数据预处理综述
前言这一篇的内容主要要讲一点在深度学习的3D目标检测网络中，我们都采用了哪些数据预处理的方法，主要讲两个方面的知识，第一个是representation，第二个数据预处理内容是数据......
Jmeter组件：直连数据库
1、是什么？jmeter可以直接与数据库进行交互2、怎么用？2.1、在测试计划中添加数据库jar包2.2、添加组件：ConfigElement--JDBCConnectionConfiguration2.3、配置数据库连接信......
数据填报有什么用？数据填报系统具有哪些优势？_光点科技
大部分数据填报都是终端用户，或者可以说是我们使用信息系统的业务人员，提供这样一个纯粹的HTML页面表结构设计、发布、管理和填报数据的页面、界面友好、简单易用的统计研究分......
.NET教程 - 反射 & 元数据（Reflection & Metadata）
更新记录转载请注明出处：2022年10月5日发布。2022年10月5日从笔记迁移到博客。反射（Reflection）介绍说明大多数情况下，我们都是运行程序集中的代码处理数据但有时需......

数据离散化

定义：

步骤:

注意：

例题

acwing103. 电影、

相关文章

赞助商

阅读排行