首页 > 数据库 >MySQL 对 bit 类型与字符判断结果不一致现象

MySQL 对 bit 类型与字符判断结果不一致现象

时间:2023-12-21 11:13:55浏览次数:37  
标签:status 字符 cc MySQL sql bit NULL id select

 

结论

涉及 bit 类型的比较时,最好给常量的比较对象都加上 b 前缀,比如a = '1'变成a = b'1',来避免结果的非预期不一致现象。

复现 SQL

CREATE TABLE t1 (
  `id` varchar(36),
  `status` bit(1),
  `open` bit(1),
  `store_id` varchar(20),
  PRIMARY KEY (`id`),
  KEY `index_status` (`store_id`, `status`)
);

INSERT INTO t1 VALUES ('7B03CF04', b'1', b'1', 'h09az');

执行上述查询,我们创建了一个包含长度为 1 的 bit 类型列 status 的表,往其中插入了一条数据。

通过以下查询我们是可以看到这条数据的:

root@localhost:test 8.0.23> SELECT * FROM t1 WHERE status = '1' AND open = '1';
+----------+----------------+------------+----------+
| id       | status         | open       | store_id |
+----------+----------------+------------+----------+
| 7B03CF04 | 0x01           | 0x01       | h09az    |
+----------+----------------+------------+----------+
1 row in set (0.00 sec)

root@localhost:test 8.0.23> EXPLAIN SELECT * FROM t1 WHERE status = '1' AND open = '1';
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+-------------+
| id | select_type | table | partitions | type | possible_keys | key  | key_len | ref  | rows | filtered | Extra       |
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+-------------+
|  1 | SIMPLE      | t1    | NULL       | ALL  | NULL          | NULL | NULL    | NULL |    1 |   100.00 | Using where |
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+-------------+
1 row in set, 1 warning (0.00 sec)

但是当我们给上述 SQL 加上一个 WHERE 条件store_id = 'h09az'后,按理说这条数据一定也能满足条件被选中,但是却返回了空结果集:

root@localhost:test 8.0.23> SELECT * FROM t1 WHERE status = '1' AND open = '1' AND store_id = 'h09az';
Empty set (0.00 sec)

root@localhost:test 8.0.23> EXPLAIN SELECT * FROM t1 WHERE status = '1' AND open = '1' AND store_id = 'h09az';
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+--------------------------------+
| id | select_type | table | partitions | type | possible_keys | key  | key_len | ref  | rows | filtered | Extra                          |
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+--------------------------------+
|  1 | SIMPLE      | NULL  | NULL       | NULL | NULL          | NULL | NULL    | NULL | NULL |     NULL | no matching row in const table |
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+--------------------------------+
1 row in set, 1 warning (0.00 sec)

很诡异的现象对不对,我们深入到代码层面分析原因,发现当带有store_id = 'h09az'条件时,store_id 字段和 status 字段组成了索引前缀, 导致优化器会考虑 RANGE 查询,在构建表示 RANGE 的 Min-Max Tree 时,会将条件中的常量 '1' 存入 status 的 field 中,在这个过程中优化器是将 '1' 当作字符来看的,因此存入的是其对应的 ASCII 码 49,这显然超出了 1 个 bit 所能表示的范围,返回 TYPE_WARN_OUT_OF_RANGE。优化器一看需要比较的等值常量超出了这个列的表示范围,自然一定不存在,所以直接返回空结果集。这个过程在下列栈中:

#0  Field_bit_as_char::store at sql/field.cc:9007
#1  0x0000000004a42b80 in Item::save_str_value_in_field at sql/item.cc:603
#2  0x0000000004a5648c in Item_string::save_in_field_inner at sql/item.cc:6551
#3  0x0000000004a559f5 in Item::save_in_field at sql/item.cc:6426
#4  0x0000000004a463b0 in Item::save_in_field_no_warnings at sql/item.cc:1632
#5  0x000000000437b67d in save_value_and_handle_conversion at sql/opt_range.cc:8170
#6  0x000000000437c75e in get_mm_leaf at sql/opt_range.cc:8588
#7  0x000000000437b328 in get_mm_parts at sql/opt_range.cc:8070
#8  0x0000000004379a94 in get_func_mm_tree at sql/opt_range.cc:7548
#9  0x0000000004379c98 in get_full_func_mm_tree at sql/opt_range.cc:7649
#10 0x000000000437abda in get_mm_tree at sql/opt_range.cc:7871
#11 0x0000000004379fb1 in get_mm_tree at sql/opt_range.cc:7720
#12 0x0000000004370621 in test_quick_select at sql/opt_range.cc:4127
#13 0x00000000044de9fa in get_quick_record_count at sql/sql_optimizer.cc:6280
#14 0x00000000044dde76 in JOIN::estimate_rowcount at sql/sql_optimizer.cc:6004
#15 0x00000000044dbfc7 in JOIN::make_join_plan at sql/sql_optimizer.cc:5371
#16 0x00000000044cee5c in JOIN::optimize at sql/sql_optimizer.cc:721
#17 0x00000000045934c0 in SELECT_LEX::optimize at sql/sql_select.cc:1844
#18 0x00000000045914ba in Sql_cmd_dml::execute_inner at sql/sql_select.cc:855
#19 0x0000000004590e15 in Sql_cmd_dml::execute at sql/sql_select.cc:713
#20 0x0000000004509ecf in mysql_execute_command at sql/sql_parse.cc:6579

当不带有store_id = 'h09az'条件时,优化器不再考虑上述过程,而是采用全表扫描,在 Server 层使用 WHERE 条件来过滤,在构建 bit 类型和 '1' 的比较符时,Arg_comparator::set_cmp_func() 是将两边都当做实数来处理的,因此会将 '1' 字符转化为整型数 1 后进行比较,与 b'1' 的等值比较是成立的,会返回这条数据。这个过程在:

#0  Arg_comparator::compare_real (this=0x7ffc7881d0f8) at sql/item_cmpfunc.cc:1933
#1  0x0000000004a90402 in Arg_comparator::compare (this=0x7ffc7881d0f8) at sql/item_cmpfunc.h:133
#2  0x0000000004a77536 in Item_func_eq::val_int (this=(Item_func_eq *) 0x7ffc7881cfd0) at sql/item_cmpfunc.cc:2579
#3  0x0000000004a41a5e in Item::val_bool (this=(Item_func_eq *) 0x7ffc7881cfd0) at sql/item.cc:306
#4  0x0000000004a8a111 in Item_cond_and::val_int (this=(Item_cond_and *) 0x7ffc78741fa8) at sql/item_cmpfunc.cc:7137
#5  0x000000000447c230 in evaluate_join_record (join=0x7ffc7881dfd0, qep_tab=0x7ffc78742168) at sql/sql_executor.cc:1835
#6  0x000000000447b9cd in sub_select (join=0x7ffc7881dfd0, qep_tab=0x7ffc78742168, end_of_records=false) at sql/sql_executor.cc:1636
#7  0x000000000447acf3 in do_select (join=0x7ffc7881dfd0) at sql/sql_executor.cc:1230
#8  0x0000000004477d07 in JOIN::exec (this=0x7ffc7881dfd0) at sql/sql_executor.cc:303
#9  0x0000000004591913 in Sql_cmd_dml::execute_inner (this=0x7ffc7881d550, thd=0x7ffc7880b000) at sql/sql_select.cc:1003
#10 0x0000000004590e15 in Sql_cmd_dml::execute (this=0x7ffc7881d550, thd=0x7ffc7880b000) at sql/sql_select.cc:713

类似的情况还存在于整型数与字符串的比较,在做 WHERE 条件的判断时,都会优先将字符串转换为整型数,甚至在下列 SQL 中a = '10ab' 都能过滤出 a = 10 这条数据,很神奇...

CREATE TABLE t2 (id varchar(10), a INT, b VARCHAR(40));
INSERT INTO t2 VALUES ('mm', 10, 'test');

root@localhost:test 8.0.23> SELECT * FROM t2 WHERE a = '10ab';
+------+------+------+
| id   | a    | b    |
+------+------+------+
| mm   |   10 | test |
+------+------+------+
1 row in set, 1 warning (0.00 sec)

总结

究其原因,是 MySQL 优化器在不同路径下对于字符串的标准不一样导致的,在构建 Min-Max Tree 时将 '1' 当作字符来处理;在执行层进行 WHERE 条件的比较时,将 '1' 当作整型数来处理,造成了理论上应该返回相同结果的 SQL 返回了不同的结果。这里也给社区提了 BUG:https://bugs.mysql.com/bug.php?id=108192,看看社区后续的修复方案。

这里究竟应该把 '1' 当作字符还是整型数来处理,可能难以有完全统一的标准,也正是 MySQL 对于语法、类型的检查不严格,才使得 MySQL 更“好用”,不管什么样的 SQL 都能顺利执行。

但是为了避免对业务结果造成一些非预期的影响,涉及 bit 类型还是都加上 b 前缀更稳妥。

https://zhuanlan.zhihu.com/p/555484197

 

标签:status,字符,cc,MySQL,sql,bit,NULL,id,select
From: https://www.cnblogs.com/softidea/p/17918550.html

相关文章

  • MySQL 8.0.12 深入理解bit类型
     背景:在阿里巴巴推荐的MySQL建表规范里要求如下:表达是与否概念的字段,必须使用is_xxx的方式命名,数据类型是unsignedtinyint(1表示是,0表示否)。解释:在MySQL里表示是和否的概念可以使用如下三种方案:1.使用bit(1)类型,此时bit允许存储的是ASCII中的0和1.0表示否1表示是的概念......
  • MySQL 获取日期、时间、时间戳
    MySQL获取当前日期、时间、时间戳函数_mysqldate_sub时间戳-CSDN博客#获取当前时间curtime()mysql>selectcurtime();+-----------+|curtime()|+-----------+|10:39:25|+-----------+#获取当前日期curdate()mysql>selectcurdate();+------------+|cur......
  • day02-MySQL
    数据库-MySQL1.数据库基础操作mysql-u用户名-p密码[-h数据库服务器的IP地址-P端口号]-h参数不加,默认连接的是本地127.0.0.1的MySQL服务器,-P参数不加,默认连接的端口号是3306eg.mysql-uroot-p1234查询所有数据库showdatabases;创建数据库created......
  • 生产环境部署过的二种mysql同步: binlog和gtid
    生产环境部署过的二种mysql同步:binlog和gtid服务器A:192.168.21.33|master|winserver2019服务器B:192.168.21.40|slave |winserver2019Mysql版本:8.0.34.0数据库连接软件:mysql-workbench-community-8.0.30-winx64(注:linux版本一样的配置方法,注意my.ini和......
  • rabbitmq listener注解@RabbitListener里的queues是个数组,你用了吗?
    靠谱的程序员具有注重实效的偏执,对于重复多行的代码,总会想办法消除重复。我们zhongtai-channel里在调用服务商接口发起签约前,使用了mq进行异步处理。即:zhongtai-channel签约RPCAPI接收到上游的请求后,先同步持久化保存签约请求流水,然后将签约数据放入rabbitmq消息队列,等待程序里......
  • MySQL-基础篇
    索引的数据结构二叉树树高度普通二叉树最坏n.红黑树二叉平衡树,树高度logn+1.以20000000条数据为例,h=log20000000=25Hash表对索引的key进行一次hash计算就可以定位出数据存储的位置很多时候Hash索引要比B+Tree更高效仅能满足=、in,不支持范围查询hash冲突问题(数组+链表)......
  • linux安装jdk和mysql
    一、jdk安装1、yum-ylistjava*------------查看所有jdk版本2、yuminstall-yjava-1.8.0-openjdk.i686 ------------------安装指定jdk,yum会使用标准方式进行下载并安装 二、mysql安装1、wgethttp://dev.mysql.com/get/mysql57-community-release-el7-8.noarch.rpm......
  • 代码随想录算法训练营第八天 | 344.反转字符串,541.反转字符串II,卡码网:54.替换数字,151.
    一、344.反转字符串题目链接:LeetCode344.反转字符串学习前:思路:相向指针。left=0,right=length-1,不停交换left和right的值时间复杂度:O(n)空间复杂度:O(1)学习后:了解swap函数通过位运算实现的方式二、541.反转字符串II题目链接:LeetCode541.反转字符串II学习前:思路:ne......
  • MySQL——子查询用法
    1、子查询概述子查询指一个查询语句嵌套在另一个查询语句内部的查询,内部的查询是外部查询的条件,这个特性从MySQL4.1开始引入。SQL中子查询的使用大大增强了SELECT查询的能力,因为很多时候查询需要从结果集中获取数据,或者需要从同一个表中先计算得出一个数据结果,然后与这个数据结果(可......
  • ICEE-Keyboard- 键盘工作原理:扫描GPIO:{X行,Y列}感应点矩阵在按键触发点感应电路{x,y
    ICEE-Keyboard-键盘工作原理:周期性扫描电路感应点矩阵:电路感应点矩阵有总共X行与总共Y列的电路感应{电容式,电阻式,开关式}点,例如总共12行,总共12列;则总共有144个键位点;电路感应点矩阵的每一行或每一列都有一条电路线直连MCU的一个GPIO;例如总共12行,总共12列;则总共需......