首页 > 其他分享 >关于decimal非常浅显的学习与整理

关于decimal非常浅显的学习与整理

时间:2023-08-20 21:57:53浏览次数:27  
标签:存储 decimal bytes digit 数值 浅显 整理 小数

关于decimal非常浅显的学习与整理


背景知识

整数,小数,浮点,定点
整数(Integer)是没有小数部分的数值,可以是正数、负数或零。在计算机中,整数通常以二进制形式存储。

小数(Decimal)是带有小数部分的数值。小数可以是有限的,也可以是无限循环的。在计算机中,小数通常以浮点数或定点数的形式存储。

浮点数(Floating-point)是一种用于表示带有小数部分的数值的方法。浮点数使用科学计数法表示,包括一个有效数字和一个指数。在计算机中,浮点数通常使用IEEE 754标准进行存储。

定点数(Fixed-point)是一种用于表示带有小数部分的数值的方法。定点数使用固定的小数点位置来表示数值。在计算机中,定点数通常以整数形式存储,并使用一个固定的缩放因子来确定小数点位置。

关于金额类型

decimal 其实在不同的编程语言, 不同的数据库里面的实现和使用都是不一样的
但是有一点是明确的:
浮点类型, 不管是float还是double 都是非精确数值类型
都会有各种除不尽的尾差问题. 

但是decimal 这种数值类型, 是精确的数值. 

decimal是一种数据类型,用于存储精确的十进制数值。它通常用于需要精确计算和存储小数的场景,例如财务应用程序或需要保留小数位数的计算。
在大多数编程语言和数据库系统中,decimal类型可以指定精度和范围。精度表示数据的总位数,而范围表示小数的小数位数。例如,decimal(10, 2)表示精度为10,小数位数为2的decimal类型。

尾差的一个展示

参照网站: https://www.cnblogs.com/danielzzz/p/16824214.html

CREATE TABLE test_float(
`f1` FLOAT,
`f2` DOUBLE,
`f3` DEC(10,2)
);

INSERT INTO test_float(f1,f2,f3) VALUES(0.47,0.47,0.47),(0.44,0.44,0.44),(0.19,0.19,0.19);

SELECT SUM(f1),SUM(f2),SUM(f3) FROM test_float;

测试结果为:
SUM(f1)             	SUM(f2)	               SUM(f3)
1.0999999940395355	1.0999999999999999	1.10

发现只有decimal 才可以精确表示数值. float和double 其实都是有小数位数的. 

关于decimal的数据库存储

自己查询了不少资料, 发现不同数据库, 比如MySQL和SQLServer 都不一样. 
MySQL 貌似采用int 类型存储 9位精确数字. 
也就是很多资料里面提到的 四个字节存储 9个数字. 
但是SQLServer的存储模式就是 1个字节存储连个数字. 

MySQL应该会有一个单独的表示符号的布尔类型的设置
整数部分和小数部分是单独进行存储. 

SQLServer的存储模式暂时还不是很清楚. 

初步怀疑 MySQL其实是采用 int类型 能够表示 42亿 也就是部分10位数的情况 
退而求其次用来表示 9位精确数字. 

SQLServer的模式 其实就是 一个字节,可以表示 256个数字. 
退而求其次表示 99 这个最大的两位数值. 

所以每个字节表示两位数. 用来进行精确数字的存储. 

但是MySQL与SQLserver 可能还比较相似. 但是与CK的存储模式可能还不一样. 

需要说明大部分资料都确认, decimal的性能是数值类型里面最差的. 除非是金额汇率等必须精确的数字

整数可以用int. 逼不得已在用decimal 

自己查了不少资料, 本来想dump 不分 raw data 但是发现没有达到自己的预期目标. 

所以几天仅是简单的进行一些汇总. 还需要较多的时间研究底层的存储模式. 

看到了 ibd2sdi 以及hexedit等工具. 但是都没有达到自己的预期. 

因为是一个周天, 大部分时间用于陪伴自己的孩子了. 学习的时间不是很充足. 

搜易今天仅是一个简单的学习与整理. 后续还需要继续探究和提高. 

阿里上面一个说明-未看懂

# 其实原理看明白了. 但是不知道数据是怎么来的
# 感觉mysql的确做的比较简单.可能浪费了部分存储空间. 但是处理起来比较简单.
# 所有的性能其实都是在调和和折中. 自己哪方面强. 哪方面可能就要多出点力. 
# 数据库与人生不一样, 强的必须得像低的低头. 人生是长板决定你的上限. 计算机是短板决定你的上限.

Synopsis
Decimal2bin ()
From-value to convert
To-points to buffer Where string representation shoshould be stored
Precision/scale-see decimal_bin_size () below

Note
The buffer is assumed to be of the size decimal_bin_size (precision, scale)

Return Value
E_dec_ OK/e_dec_truncated/e_dec_overflow

Description
For storage decimal numbers are converted to the "binary" format.

This format has the following properties:
1. Length of the binary representation depends on the {precision, scale}
As provided by the caller and not on the intg/frac of the decimal
Convert.
2. Binary representations of the same {precision, scale} can be compared
With memcmp-with the same result as decimal_cmp () of the original
Decimals (not taking into account possible precision loss
Conversion ).

This binary format is as follows:
1. First the number is converted to have a requested precision and scale.
2. Every full dig_per_dec1 digits of intg part are stored in 4 bytes
As is
3. The first intg % dig_per_dec1 digits are stored in the specified CED
Number of bytes (enough bytes to store this number of digits-
See dig2bytes)
4. Same for frac-full decimal_digit_t's are stored as is,
The last frac % dig_per_dec1 digits-in the specified ced number of bytes.
5. If the number is negative-every byte is inversed.
5. The very first bit of the resulting byte array is inverted (because
Memcmp compares unsigned bytes, see property 2 above)

Example:

1234567890.1234

Internally is represented as 3 decimal_digit_t's

1 234567890 123400000

(Assuming we want a binary representation with precision = 14, scale = 4)
In hex it's

00-00-00-01 0d-fb-38-d2 07-5a-ef-40

Now, middle decimal_digit_t is full-It stores 9 decimal digits. It goes
Into binary representation as is:

...... 0d-fb-38-d2 ............

First decimal_digit_t has only one decimal digit. We can store one digit in
One byte, no need to waste four:

01 0d-fb-38-d2 ............

Now, last digit. It's 123400000. We can store 1234 in two bytes:

01 0d-fb-38-d2 04-d2

So, we 've packed 12 bytes number in 7 bytes.
And now we invert the highest bit to get the final result:

81 0d FB 38 D2 04 D2

And for-1234567890.1234 it wocould be

7E F2 04 37 2D FB 2D

This article is an English version of an article which is originally in the Chinese language on aliyun.com and is provided for information purposes only. This website makes no representation or warranty of any kind, either expressed or implied, as to the accuracy, completeness ownership or

标签:存储,decimal,bytes,digit,数值,浅显,整理,小数
From: https://www.cnblogs.com/jinanxiaolaohu/p/17644689.html

相关文章

  • Oracle 分区表自动管理(待整理)
    原文-https://github.com/aws-samples/automate-table-partitioning-in-oracle-standard-edition/tree/main/partitions/scripts需要调整的地方有:1.droptable未释放垃圾空间2.未提及到收缩HWM释放空间partitions/scripts/partition_mgmt_tables.sql---partitions/sc......
  • 对博客的整理须知Ⅰ
    对博客的整理须知Ⅰ做题笔记今日起针对博客题解进行汇总。具体来说将会汇总为以周为单位的做题笔记,并在每个做题笔记内按模块分类。大体归为(优先级以更靠前为准):1.特殊技巧2.博弈论3.构造4.贪心5.动态规划6.字符串7.图论8.数学9.搜索以此方便对知识点及技巧的汇总与......
  • C++ 虚继承,虚函数与纯虚函数整理
    1.虚继承虚继承是用于解决多继承中“菱形继承”问题的一种技术。在多继承中,如果两个基类都继承了同一个基类,派生类会包含两份该基类的数据成员和函数成员,从而产生冗余和二义性。虚继承的作用就是消除这种冗余。虚继承的定义方式是在继承关系中添加关键字“virtual”,如下所示:cl......
  • c++ 面试整理
    如何理解封装、继承、多态封装可以隐藏实现细节,使得代码模块化;封装是把过程和数据包围起来,对数据的访问只能通过已定义的界面。面向对象计算始于这个基本概念,即现实世界可以被描绘成一系列完全自治、封装的对象,这些对象通过一个受保护的接口访问其他对象。多态多态指同一个实......
  • Java中BigDecimal怎样取反
    在Java中,正确的类名应该是BigDecimal,而不是bigdemcial。BigDecimal用于高精度的十进制计算。要对BigDecimal对象进行取反操作,可以使用negate()方法。以下是一个示例:importjava.math.BigDecimal;publicclassMain{publicstaticvoidmain(String[]args){BigDe......
  • 笔记整理--C语言--C语言指针5分钟教程——转载
    C语言指针5分钟教程指针、引用和取值什么是指针?什么是内存地址?什么叫做指针的取值?指针是一个存储计算机内存地址的变量。在这份教程里“引用”表示计算机内存地址。从指针指向的内存读取数据称作指针的取值。指针可以指向某些具体类型的变量地址,例如int、long和double。指针也可......
  • 笔记整理--C语言--Stack的三种含义 - 博客 - 伯乐在线——转载
    【转载】:原文http://www.ruanyifeng.com/blog/2013/11/stack.htmlStack的三种含义-博客-伯乐在线-转载Stack的三种含义学习编程的时候,经常会看到stack这个词,它的中文名字叫做”栈”。理解这个概念,对于理解程序的运行至关重要。容易混淆的是,这个词其实有三种含义,适用于......
  • 笔记整理--C语言--失落的C语言结构体封装艺术 - 博客 - 伯乐在线——转载
    失落的C语言结构体封装艺术-博客-伯乐在线转载1.谁该阅读这篇文章本文是关于削减C语言程序内存占用空间的一项技术——为了减小内存大小而手工重新封装C结构体声明。你需要基本的C语言的基本知识来读懂本文。如果你要为内存有限制的嵌入式系统、或者操作系统内核写代码,那......
  • 笔记整理--C语言--数组指针和指针数组的区别 - hongcha_717 - 博客园——转载
    【转载】:原文http://www.cnblogs.com/hongcha717/archive/2010/10/24/1859780.html数组指针和指针数组的区别数组指针(也称行指针)定义int(*p)[n];()优先级高,首先说明p是一个指针,指向一个整型的一维数组,这个一维数组的长度是n,也可以说是p的步长。也就是说执行p+1时,p要跨过n个......
  • 笔记整理--C语言--linux下错误的捕获:errno和strerror的使用——转载
    linux下错误的捕获:errno和strerror的使用经常在调用linux系统api的时候会出现一些错误,比方说使用open()、write()、creat()之类的函数有些时候会返回-1,也就是调用失败,这个时候往往需要知道失败的原因。这个时候使用errno这个全局变量就相当有用了。在程序代码中包含#include<e......