首页 > 数据库 >PostgreSQL数据库支持中文拼音和笔画排序

PostgreSQL数据库支持中文拼音和笔画排序

时间:2023-05-06 09:02:35浏览次数:56  
标签:zh 拼音 UTF8 col2 postgres Hans PostgreSQL icu 笔画

PostgreSQL数据库支持中文拼音和笔画排序

1.前言

默认安装,PG是不支持中文拼音和笔画排序的。

1postgres=# select * from pg_settings where name ~ 'collate';
2    name    | setting | unit |    category    |            short_desc             | extra_desc | context  | vartype |  source  | min_val
3 | max_val | enumvals | boot_val | reset_val | sourcefile | sourceline | pending_restart
4------------+---------+------+----------------+-----------------------------------+------------+----------+---------+----------+--------
5-+---------+----------+----------+-----------+------------+------------+-----------------
6 lc_collate | C       |      | Preset Options | Shows the collation order locale. |            | internal | string  | override |
7 |         |          | C        | C         |            |            | f
8(1 row)

看看示例:

 1postgres=# create table t(id int, col2 varchar(32));
 2CREATE TABLE
 3postgres=# insert into t values(1, '东城'), (2, '西城'), (3, '石景山'), (4, '海淀'), (5, '朝阳');
 4INSERT 0 5
 5postgres=# select * from t order by col2;
 6 id |  col2
 7----+--------
 8  1 | 东城
 9  5 | 朝阳
10  4 | 海淀
11  3 | 石景山
12  2 | 西城
13(5 rows)

这是collate=C的排序结果。

2.实现与实践

支持中文排序,需要配置依赖 --with-icu.这就需要提交安装依赖包:libicu-devel libicu

1)、编译安装:

1wget https://ftp.postgresql.org/pub/source/v15.2/postgresql-15.2.tar.gz
2
3sudo su -c "yum install libicu-devel libicu libxml2-devel libxslt-devel"
4
5./configure --prefix=/usr/pgsql-15-icu --with-icu --with-libxml --with-libxslt --with-openssl
6
7make -j 4 world-bin
8sudo su -c "make install-world-bin"

2)、环境变量配置

env15.sh

1export PGROOT=/usr/pgsql-15-icu
2export PGHOME=/var/lib/pgsql/15
3export PGPORT=5432
4export PGDATA=$PGHOME/data
5export PATH=$PGROOT/bin:$PATH
6export LD_LIBRARY_PATH=$PGROOT/lib:$LD_LIBRARY_PATH

1source env15.sh

3)、初始化db如下:

1initdb -D $PGDATA -U postgres -E UTF8 --lc-collate=C --lc-ctype=en_US.UTF8 --locale-provider=icu --icu-locale=C

4)、启动db进行验证

 1postgres=# select collname,pg_encoding_to_char(collencoding),colliculocale from
 2pg_collation  where collname ~ 'zh';
 3     collname     | pg_encoding_to_char | colliculocale
 4------------------+---------------------+---------------
 5 zh_CN            | EUC_CN              |
 6 zh_CN.gb2312     | EUC_CN              |
 7 zh_CN.utf8       | UTF8                |
 8 zh_HK.utf8       | UTF8                |
 9 zh_SG            | EUC_CN              |
10 zh_SG.gb2312     | EUC_CN              |
11 zh_SG.utf8       | UTF8                |
12 zh_TW.euctw      | EUC_TW              |
13 zh_TW.utf8       | UTF8                |
14 zh_CN            | UTF8                |
15 zh_HK            | UTF8                |
16 zh_SG            | UTF8                |
17 zh_TW            | EUC_TW              |
18 zh_TW            | UTF8                |
19 zh-x-icu         |                     | zh
20 zh-Hans-x-icu    |                     | zh_Hans
21 zh-Hans-CN-x-icu |                     | zh_Hans_CN
22 zh-Hans-HK-x-icu |                     | zh_Hans_HK
23 zh-Hans-MO-x-icu |                     | zh_Hans_MO
24 zh-Hans-SG-x-icu |                     | zh_Hans_SG
25 zh-Hant-x-icu    |                     | zh_Hant
26 zh-Hant-HK-x-icu |                     | zh_Hant_HK
27 zh-Hant-MO-x-icu |                     | zh_Hant_MO
28 zh-Hant-TW-x-icu |                     | zh_Hant_TW
29(24 rows)
30
31postgres=# \l
32                                               List of databases
33   Name    |  Owner   | Encoding | Collate |   Ctype    | ICU Locale | Locale Provider |   Access privileges
34-----------+----------+----------+---------+------------+------------+-----------------+-----------------------
35 postgres  | postgres | UTF8     | C       | en_US.UTF8 | C          | icu             |
36 template0 | postgres | UTF8     | C       | en_US.UTF8 | C          | icu             | =c/postgres          +
37           |          |          |         |            |            |                 | postgres=CTc/postgres
38 template1 | postgres | UTF8     | C       | en_US.UTF8 | C          | icu             | =c/postgres          +
39           |          |          |         |            |            |                 | postgres=CTc/postgres
40(3 rows)

建表及数据:

 1postgres=# create table t(id int, col2 varchar(32));
 2CREATE TABLE
 3postgres=# insert into t values(1, '东城'), (2, '西城'), (3, '石景山'), (4, '海淀'), (5, '朝阳');
 4INSERT 0 5
 5postgres=# select * from t order by col2;
 6 id |  col2
 7----+--------
 8  1 | 东城
 9  5 | 朝阳
10  4 | 海淀
11  3 | 石景山
12  2 | 西城
13(5 rows)

重新排序:

按拼音:(collate "zh-x-icu")

1postgres=# select * from t order by col2 collate "zh-x-icu";
2 id |  col2
3----+--------
4  5 | 朝阳
5  1 | 东城
6  4 | 海淀
7  3 | 石景山
8  2 | 西城
9(5 rows)

按拼音:collate "zh-Hans-x-icu"

1postgres=# select * from t order by col2 collate "zh-Hans-x-icu";
2 id |  col2
3----+--------
4  5 | 朝阳
5  1 | 东城
6  4 | 海淀
7  3 | 石景山
8  2 | 西城
9(5 rows)

按笔画:collate "zh-Hant-x-icu";

1postgres=# select * from t order by col2 collate "zh-Hant-x-icu";
2 id |  col2
3----+--------
4  1 | 东城
5  3 | 石景山
6  2 | 西城
7  4 | 海淀
8  5 | 朝阳
9(5 rows)

提示:

  • zh, 按拼音排序
  • zh-Hant, 繁体, 按存储文字的笔画数排序
  • zh-Hans, 简体, 按拼音排序

注意上边这一块结果就好:

 

参考:

[1] https://github.com/digoal/blog/

[2] https://www.postgresql.org/docs/current/collation.html:
https://www.postgresql.org/docs/current/collation.html

 

标签:zh,拼音,UTF8,col2,postgres,Hans,PostgreSQL,icu,笔画
From: https://www.cnblogs.com/chuangsi/p/17375886.html

相关文章

  • PostgreSQL 基础知识:psql 提示和技巧
    对于积极使用和连接到PostgreSQL数据库的任何开发人员或DBA来说,能够访问psql命令行工具是必不可少的。在我们的第一篇文章中,我们讨论了psql的简要历史,并演示了如何在您选择的平台上安装它并连接到PostgreSQL数据库。在本文中,我们将帮助您了解成为高级用户所需了解的所有ps......
  • PostgreSQL 12 文档: PostgreSQL 客户端工具
    PostgreSQL客户端应用这部份包含PostgreSQL客户端应用和工具的参考信息。不是所有这些命令都是通用工具,某些需要特殊权限。这些应用的共同特征是它们可以被运行在任何主机上,而不管数据库服务器在哪里。当在命令行上指定用户和数据库名时,它们的大小写会被保留—空格或特殊字......
  • PostgreSQL 12 文档: PostgreSQL 服务端程序
    PostgreSQL服务器应用这一部分包含PostgreSQL服务器应用和支持工具的参考信息。这些命令只在数据库服务器所在的主机上运行才有用。其他工具程序在PostgreSQL客户端应用中列出。目录initdb —创建一个新的PostgreSQL数据库集簇pg_archivecleanup —清理PostgreSQL WAL......
  • PostgreSQL 生成随机整数
    首先random()函数用于生成0-1之间的随机数postgres=#SELECTrandom()asrand;rand--------------------0.6296923727161818(1row)取整函数有ceil()floor()trunc()postgres=#SELECTceil(1.5)asceil,floor(1.5)asfloor,trunc(1.5)astrunc;ceil|fl......
  • PostgreSQL 12 文档: 部分 I. 教程
    部分 I. 教程欢迎来到PostgreSQL教程。下面的几章将为那些新接触PostgreSQL、关系数据库概念和SQL语言的读者给出一个简单介绍。我们只假定读者拥有关于如何使用计算机的一般知识。读者不需要特殊的Unix或编程经验。这一部分主要希望给你一些关于PostgreSQL系统的重要方面......
  • PostgreSQL 执行计划
    查询计划扫描结点顺序扫描索引扫描只用索引的扫描位图堆扫描位图索引扫描公共表表达式的扫描自定义扫描外表扫描函数结果扫描子查询扫描表样本扫描行地址扫描行集合扫描工作表扫描连接结点哈希连接合并连接嵌套连接物化结点聚合位图与位图或分组......
  • postgresql有进程链接数据时删除数据库
    selectpg_terminate_backend(pg_stat_activity.pid)frompg_stat_activitywheredatname='数据库名称'andpid<>pg_backend_pid();命令解释:pg_terminate_backend:用来终止与数据库的连接的进程id的函数。pg_stat_activity:是一个系统表,用于存储服务进程的属性和状态。pg_......
  • Python: PostgreSQL
     connectionimportpsycopg2frompsycopg2importError,connection,cursorconn:connection|None=Nonec1:cursor|None=Nonetry:conn=psycopg2.connect(host='localhost',port=5432,user='postgres',......
  • PostgreSQL
    PostgreSQL是以加州大学伯克利分校计算机系开发的POSTGRES,版本4.2为基础的对象关系型数据库管理系统(ORDBMS)。PostgreSQL支持大部分SQL标准并且提供了许多其他现代特性:复杂查询、外键、触发器、视图、事务完整性、多版本并发控制。同样,PostgreSQL可以用许多方法扩展,比如,通过增......
  • PostgreSQL技术大讲堂 - 第15讲:数据文件与块存储结构
     PostgreSQL从小白到专家,是从入门逐渐能力提升的一个系列教程,内容包括对PG基础的认知、包括安装使用、包括角色权限、包括维护管理、、等内容,希望对热爱PG、学习PG的同学们有帮助,欢迎持续关注CUUGPG技术大讲堂。Part15:数据文件与块存储结构内容1:表的OID与数据文件对应关系......