mysql数据库排序规则如何修改，mysql排序上下自定义排序

迅捷 • 2022年4月9日上午1:09 • 投稿

在日常工作中，对于MySQL排序规则，很少关注，大部分时候都是直接使用字符集默认的排序规则，常常忽视了排序规则的细节问题，了解排序规则有助于更好的理解MySQL字符比较和排序相关的知识

简述

说起排序规则就离不开字符集，严格来说，排序规则是依赖于字符集的

字符集是用来定义MySQL存储不同字符的方式，而排序规则一般指对字符集中字符串之间的比较、排序制定的规则。一种字符集可以对应多种排序规则，但是一种排序规则只能对应指定的一种字符集，两个不同的字符集不能有相同的排序规则

上图中，Collation 列表示排序方式，Charset 列表示字符集，可以看出 utf8 字符集对应着许多的排序方式，排序方式那一列每一项的值都不一样，并且每一项都对应唯一一种字符集，在这里是 utf8 字符集

默认排序规则

字符集的默认排序规则

每种字符集都有一个默认的排序规则, 可以通过下面的SQL语句查询指定字符集的默认排序规则

mysql> show character set like 'utf8%';
+---------+---------------+--------------------+--------+
| Charset | Description   | Default collation  | Maxlen |
+---------+---------------+--------------------+--------+
| utf8    | UTF-8 Unicode | utf8_general_ci    |      3 |
| utf8mb4 | UTF-8 Unicode | utf8mb4_general_ci |      4 |
+---------+---------------+--------------------+--------+
2 rows in set (0.00 sec)

上面的例子是查询字符集前缀包含utf8的默认排序方式，从中可以得知：

utf8字符集的默认排序方式是 utf8_general_ci 字符集中字符最大长度占3个字节

utf8mb4 字符集的默认排序方式是 utf8mb4_general_ci 字符集中字符最大长度占4个字节

数据库的默认排序规则

MySQL服务器的默认字符集可以在 /etc/my.cnf 配置中的 [mysqld] 下修改

例如：现需要把MySQL服务器的默认字符集设置为 utf8, 默认排序规则设置为 utf8_general_ci, 只需要在 /etc/my.cnf 配置文件的 [mysqld] 下添加以下子项

character-set-server=utf8
collation-server=utf8_general_ci

创建数据库的时候如果没有指定字符集，会使用MySQL服务器默认字符集和默认排序规则

假如: 在下面例子中，MySQL服务器的默认字符集和默认排序规则分别是 utf8 和 utf8_general_ci

mysql> create database at;
Query OK, 1 row affected (0.00 sec)
mysql> select SCHEMA_NAME,DEFAULT_CHARACTER_SET_NAME,DEFAULT_COLLATION_NAME from INFORMATION_SCHEMA.SCHEMATA where SCHEMA_NAME='at';
+-------------+----------------------------+------------------------+
| SCHEMA_NAME | DEFAULT_CHARACTER_SET_NAME | DEFAULT_COLLATION_NAME |
+-------------+----------------------------+------------------------+
| at          | utf8                       | utf8_general_ci        |
+-------------+----------------------------+------------------------+
1 row in set (0.00 sec)

在上面的例子中，创建了 at 数据库，创建数据库的时候没有为数据库指定字符集和排序规则，此时会使用 MySQL服务器的默认字符集和排序规则

通过SQL语句查询 at 数据库的默认字符集和默认排序规则，结果和MySQL服务器的默认字符集和默认排序规则是一样的

排序规则命名以及名字后缀

命名

排序规则的命名是以和它自身关联的字符集名字开头的，后面再接一个或多个后缀来表示指定字符集的一种排序规则

例如：utf8_general_ci 和 utf8_bin 就是 utf8字符集的两种排序规则, latin1_swedish_ci 是 latin1字符集的排序规则

注意： binary 字符集只有一种排序规则,并且它的排序规则名字和字符集名字一样, 也是 binary

后缀

排序规则名字的后缀是有特殊意义的，根据后缀可以知道排序规则是否区分大小写，是否区分重音，是否是二进制等等，下面列出了部分后缀的说明

_ci : 不区分大小写, Case-insensitive的缩写
_cs : 区分大小写，Case-sensitive的缩写
_ai : 不区分重音，Accent-insensitive的缩写
_as : 区分重音，Accent-sensitive的缩写
_bin : 二进制

1: 不区分大小写

mysql> SET NAMES 'utf8' COLLATE 'utf8_unicode_ci';
Query OK, 0 rows affected (0.02 sec)
mysql> select 'a' = 'A';
+-----------+
| 'a' = 'A' |
+-----------+
|         1 |
+-----------+
1 row in set (0.00 sec)

例子中排序规则为 utf8_unicode_ci 是不区分大小写的，所以字符 a 和字符 A 会被当做相同字符处理

2: 区分大小写

mysql> SET NAMES 'latin1' COLLATE 'latin1_general_cs';
Query OK, 0 rows affected (0.00 sec)
mysql> select 'a' = 'A';
+-----------+
| 'a' = 'A' |
+-----------+
|         0 |
+-----------+
1 row in set (0.00 sec)

例子中排序规则为 latin1_general_cs 是会区分大小写的，所以字符 a 和字符 A 会被认为是两个不同的字符

3: 二进制

mysql> SET NAMES 'utf8' COLLATE 'utf8_bin';
Query OK, 0 rows affected (0.00 sec)
mysql>  select 'a' = 'A';
+-----------+
| 'a' = 'A' |
+-----------+
|         0 |
+-----------+
1 row in set (0.00 sec)
mysql> select 'à' = 'a';
+------------+
| 'à' = 'a'  |
+------------+
|          0 |
+------------+
1 row in set (0.00 sec)

上面例子使用的排序规则是 utf8_bin 从结果可以得知：utf8_bin 排序规则区分大小写，也区分重音字符

4: 是否区分重音

重音字符是类似 à、ě、ň 的字符，不区分重音是指字符 a和 à、e和ě 以及 n和ň 被认为是同一个字符

对于非二进制(后缀为 _bin)的排序规则, 如果排序规则名字后缀不包含 _ai 和 _as, 则排序规则名称中的 _ci 默认隐含了_ai, _cs默认隐含了_as

例如: utf8_unicode_ci排序规则是不区分大小写并且隐含不区分重音的

latin1_general_cs 排序规则是区分大小写并且隐含区分重音的

具体的请查看下面的例子

mysql> SET NAMES 'utf8' COLLATE 'utf8_unicode_ci';
Query OK, 0 rows affected (0.02 sec)
mysql> select 'à' = 'a';
+------------+
| 'à' = 'a'  |
+------------+
|          1 |
+------------+
1 row in set (0.00 sec)
mysql>  SET NAMES 'latin1' COLLATE 'latin1_general_cs';
Query OK, 0 rows affected (0.00 sec)
mysql> select 'à' = 'a';
+------------+
| 'à' = 'a'  |
+------------+
|          0 |
+------------+
1 row in set (0.01 sec)

查看排序规则

查看数据库数据库的排序规则

方法1: INFORMATION_SCHEMA.SCHEMATA表中的 DEFAULT_COLLATION_NAME 字段表示数据库的排序规则，可以通过下面的SQL语句获得指定数据库的排序规则

mysql>  select SCHEMA_NAME,DEFAULT_CHARACTER_SET_NAME,DEFAULT_COLLATION_NAME from INFORMATION_SCHEMA.SCHEMATA where SCHEMA_NAME='at';
+-------------+----------------------------+------------------------+
| SCHEMA_NAME | DEFAULT_CHARACTER_SET_NAME | DEFAULT_COLLATION_NAME |
+-------------+----------------------------+------------------------+
| at          | latin1                     | latin1_swedish_ci      |
+-------------+----------------------------+------------------------+
1 row in set (0.00 sec)

上面的例子是查看 at 数据库的字符集和排序规则，从结果可以得知：at数据库的排序规则是latin1_swedish_ci

方法2：直接查询 collation_database 变量值

mysql> use at;
Database changed
mysql> show variables like 'collation_database';
+--------------------+-------------------+
| Variable_name      | Value             |
+--------------------+-------------------+
| collation_database | latin1_swedish_ci |
+--------------------+-------------------+
1 row in set (0.00 sec)

实例中 use at SQL语句切换到 at 数据库，然后使用 show variables like ‘collation_database’; 语句查询 at数据库的排序规则

查看表的排序规则

方法1：根据数据库名和表名查看 INFORMATION_SCHEMA.TABLES 表中的 TABLE_COLLATION 字段，可以得到指定数据库中指定表的排序规则，具体的实例如下所示：

mysql> SELECT TABLE_SCHEMA, TABLE_NAME,TABLE_COLLATION FROM INFORMATION_SCHEMA.TABLES where TABLE_SCHEMA='test' and TABLE_NAME = 'tc';
+--------------+------------+-----------------+
| TABLE_SCHEMA | TABLE_NAME | TABLE_COLLATION |
+--------------+------------+-----------------+
| test         | tc         | utf8_general_ci |
+--------------+------------+-----------------+
1 row in set (0.00 sec)

方法2：执行 show create table 表名语句查看

mysql> show create table tc\G
*************************** 1. row ***************************
Table: tc
Create Table: CREATE TABLE `tc` (
`id` int(11) NOT NULL,
`a` char(32) NOT NULL,
`b` char(32) CHARACTER SET utf8 COLLATE utf8_bin NOT NULL,
`c` char(32) CHARACTER SET latin1 COLLATE latin1_general_cs NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8
1 row in set (0.00 sec)

上面的例子中, show create table tc\G 是查看 tc 表的创建语句，一般创建表的时候会指定排序规则，例子中没有显示指定表的排序规则，这是因为使用的是字符集的默认排序规则，tc 表的字符集是 utf8 , 默认的排序规则是 utf8_general_ci

查看字段的排序规则

上面查看表的排序规则小节的方法2 是查看表的创建语句，字段的排序规则也可以从表创建语句中查看到，如果没有显示指定字段的排序规则，创建表的语句中是看不到排序规则的，这表示该字段使用字符集的默认排序方式

mysql> show create table tc\G
*************************** 1. row ***************************
Table: tc
Create Table: CREATE TABLE `tc` (
`id` int(11) NOT NULL,
`a` char(32) NOT NULL,
`b` char(32) CHARACTER SET utf8 COLLATE utf8_bin NOT NULL,
`c` char(32) CHARACTER SET latin1 COLLATE latin1_general_cs NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8
1 row in set (0.00 sec)

上面例子中,表 tc的字符集是utf8

字段 a 没有显示指定排序规则，则它使用的是utf8字符集的默认排序规则utf8_general_ci

字段 b 的排序规则是 utf8_bin

字段 c 的排序规则是 latin1_general_cs

修改排序规则

修改数据库的排序规则

数据库的默认排序规则可以通过 alter database 数据库名 collate 新的排序规则名字 SQL语句进行修改

mysql> select SCHEMA_NAME,DEFAULT_CHARACTER_SET_NAME,DEFAULT_COLLATION_NAME from INFORMATION_SCHEMA.SCHEMATA where SCHEMA_NAME='at';
+-------------+----------------------------+------------------------+
| SCHEMA_NAME | DEFAULT_CHARACTER_SET_NAME | DEFAULT_COLLATION_NAME |
+-------------+----------------------------+------------------------+
| at          | utf8                       | utf8_general_ci        |
+-------------+----------------------------+------------------------+
1 row in set (0.00 sec)
mysql> alter database at collate utf8_bin;
Query OK, 1 row affected (0.00 sec)
mysql> select SCHEMA_NAME,DEFAULT_CHARACTER_SET_NAME,DEFAULT_COLLATION_NAME from INFORMATION_SCHEMA.SCHEMATA where SCHEMA_NAME='at';
+-------------+----------------------------+------------------------+
| SCHEMA_NAME | DEFAULT_CHARACTER_SET_NAME | DEFAULT_COLLATION_NAME |
+-------------+----------------------------+------------------------+
| at          | utf8                       | utf8_bin               |
+-------------+----------------------------+------------------------+
mysql> alter database at collate latin1_swedish_ci ;
Query OK, 1 row affected (0.00 sec)
mysql> select SCHEMA_NAME,DEFAULT_CHARACTER_SET_NAME,DEFAULT_COLLATION_NAME from INFORMATION_SCHEMA.SCHEMATA where SCHEMA_NAME='at';
+-------------+----------------------------+------------------------+
| SCHEMA_NAME | DEFAULT_CHARACTER_SET_NAME | DEFAULT_COLLATION_NAME |
+-------------+----------------------------+------------------------+
| at          | latin1                     | latin1_swedish_ci      |
+-------------+----------------------------+------------------------+
1 row in set (0.00 sec)

上面的例子中，at 数据库初始的字符集和排序规则分别是 utf8 和 utf8_general_ci

SQL语句: alter database at collate utf8_bin; 把字符集和排序规则修改为 utf8 和 utf8_bin

SQL语句: alter database at collate latin1_swedish_ci; 把字符集和排序规则修改为 latin1 和 latin1_swedish_ci

由于latin1_swedish_ci排序规则是属于latin1字符集，所以 at 数据库排序规则修改成 latin1_swedish_ci 之后，字符集相应的也会由 utf8 变成 latin1

修改表的排序规则

通过 alter table 表名 collate 新的排序规则名字; 语句可以修改表的排序规则

注意：上面的语句修改表排序规则，对现有字段的排序规则没影响，只影响后续新添加字段的默认排序规则

mysql> show create table tc\G
*************************** 1. row ***************************
Table: tc
Create Table: CREATE TABLE `tc` (
`id` int(11) NOT NULL,
`a` char(32) NOT NULL,
`b` char(32) CHARACTER SET utf8 COLLATE utf8_bin NOT NULL,
`c` char(32) CHARACTER SET latin1 COLLATE latin1_general_cs NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8
1 row in set (0.00 sec)
mysql> alter table tc collate latin1_swedish_ci;
Query OK, 0 rows affected (0.00 sec)
Records: 0  Duplicates: 0  Warnings: 0
mysql> show create table tc\G
*************************** 1. row ***************************
Table: tc
Create Table: CREATE TABLE `tc` (
`id` int(11) NOT NULL,
`a` char(32) CHARACTER SET utf8 NOT NULL,
`b` char(32) CHARACTER SET utf8 COLLATE utf8_bin NOT NULL,
`c` char(32) CHARACTER SET latin1 COLLATE latin1_general_cs NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=latin1
1 row in set (0.00 sec)

上面例子中，tc表初始的字符集是utf8,默认排序规则是utf8_general_ci 执行 alter table tc collate latin1_swedish_ci;SQL语句把表的排序规则修改成latin1_swedish_ci

由于latin1_swedish_ci排序规则是属于latin1字符集的，所以此时表的字符集也会修改成latin1

修改表排序规则之前，字段a的排序规则是默认的utf8_general_ci，在创建表的语句中没有显示出来

修改排序规则之后，由于表默认的排序规则发生的变化，所以字段a会显示出它原本的字符集

修改字段的排序规则

mysql> show create table tc\G
*************************** 1. row ***************************
Table: tc
Create Table: CREATE TABLE `tc` (
`id` int(11) NOT NULL,
`a` char(32) CHARACTER SET utf8 NOT NULL,
`b` char(32) CHARACTER SET utf8 COLLATE utf8_bin NOT NULL,
`c` char(32) CHARACTER SET latin1 COLLATE latin1_general_cs NOT NULL,
`d` char(32) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=latin1
1 row in set (0.00 sec)
mysql> alter table tc modify b char(32) not null  collate latin1_general_cs;
Query OK, 0 rows affected (0.05 sec)
Records: 0  Duplicates: 0  Warnings: 0
mysql> show create table tc\G
*************************** 1. row ***************************
Table: tc
Create Table: CREATE TABLE `tc` (
`id` int(11) NOT NULL,
`a` char(32) CHARACTER SET utf8 NOT NULL,
`b` char(32) CHARACTER SET latin1 COLLATE latin1_general_cs NOT NULL,
`c` char(32) CHARACTER SET latin1 COLLATE latin1_general_cs NOT NULL,
`d` char(32) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=latin1
1 row in set (0.00 sec)

上面例子中，字段 b 原始的字符集和排序规则分别是 utf8、utf8_bin

语句 alter table tc modify b char(32) not null collate latin1_general_cs;把字段 b 的排序规则修改成 latin1_general_cs, 由于latin1_general_cs 排序规则是属于latin1字符集, 所以修改之后字段 b 的字符集和排序规则都发生了变化

小结

本文介绍了MySQL字符集的排序规则，由于篇幅原因，有些点没有涉及到，更多排序规则有关的细节可以自行查阅MySQL官方文档

迅捷注册用户

0 0

黄玉髓的功效与作用是什么（黄玉髓价值与保养方法）

黄玉髓黄玉髓是另一系列的晶石，有时也叫做托柏斯石，但并不是黄水晶。黄玉髓的颜色，大多数是黄色，但也有透明无色。黄玉髓与黄水晶的功用大致上相同，但却没有黄水晶那么燥热及猛烈的特性。…

小多多
2022年1月31日 • 投稿
美容贷是什么(美容贷会产生什么后果)

爱美之心人皆有之，但是为了美而背负沉重的债务是否值得呢？近日看新闻报道看到有人因爱美，而背负沉重的债务。那么什么是美容贷呢，它不还后续会产生什么后果呢？美容贷是一种针对有美容…

小多多
投稿 2022年1月18日
投稿

面基是什么意思（面基）

面基是什么意思（面基）首先我普及一下这个面基是什么意思？面基就是两个人约好见面，大多数场景用在网友之间。为什么会出现很多面基翻车的案例？因为面基的风险非常大，同样都是剩下的，怎…

xswh
2022年3月31日
点赞员兼职平台加入(哪个app赚钱快又多适合学生)

我也是偶然发现的，可能大部分人不知道，不屑玩，那就是头条极速版。一天多的时候可以赚个10来块钱。不过收益会减少，主要是看看广告。不过比较稳定。也没有套路，提现也很方便。没事可以赚点…

小多多
杂谈 2021年12月13日
投稿

世界女子游泳十大名将(世界上前十名游泳冠军女)

世界女子游泳名将众多，可谓星光璀璨，然而在这些世界泳坛女名将中，有哪些奖牌数最多，知名度最高，影响力最大呢，本榜单根据世界泳坛名将名录，总结了十大女子游泳世界名将排名，其中有凯蒂莱…

默默
2022年5月4日
投稿

555.55克拉切割钻石事件始末(Enigma黑钻价值多少钱)

扬帆号2022年01月19日最新消息，555.55克拉切割钻石事件始末，Enigma黑钻价值多少钱。想要了解具体内容是什么，请继续往下看，相信本文内容将对你会有所帮助。全球最大切割…

季候
2022年4月6日
谷雨护肤品真的好用吗（谷雨洗面奶到底好不好）

对于过了40岁的女人来说，抗老永不停歇，因为如果一旦停下来，就会发现衰老的速度会比时间还要快。那衰老会造成皮肤弹性纤维弹性下降，胶原蛋白流失，导致出现面部的皱纹和垮脸。所以在抗老的…

迅捷
2022年4月9日 • 投稿
投稿

武汉十大热门楼盘排行榜(武汉最好的楼盘排名)

武汉是首批沿江对外开放城市的之一，亦是外商投资中部的首选城市，作为“新一线”，武汉最近几年的房价持续看涨；本文为大家带来了一份武汉楼盘排名榜，其中有武汉热门楼盘、武汉人气小区，如旭…

默默
2022年5月4日
什么行业一年可挣到100万？(干什么生意一年挣百万)

在当前经济形势下，要想一年挣到100万，指望打工很困难，做小生意呢？也是凤毛麟角，那只有投资或者创业才有希望。那么，现在还有哪些行业的创业项目一年能挣100万呢？我说明自己的看法，…

默默
2022年5月4日 • 投稿
理性消费有多重要？怎么做到理性消费？

生活本不需要过多的物质，在古人看来，能吃饱饭，有个温暖的住所，那就是好生活了，更别说现在的抽水马桶，现代卫生间绝对是古人不敢想象的。人的欲望是无穷的，平平淡淡才是真，切莫让“消费主…

嗑学家
投稿 2021年11月20日
抖音直播运营是干什么的？具体要怎么做？

随着短视频行业的发展，越来越多的人在抖音上开起了属于自己的直播间。抖音直播间里的主播或是分享、或是传道、或是授业、或是促销，这些通通都离不开直播间流量。而吸取流量最关键的离不开直播…

电商营销
投稿 2021年11月20日
苹果xr实体店还有卖吗（xr多少钱）

其实iPhone XR这部手机已经是苹果在2018年发布的手机了，也是当年销量最好的一部苹果手机，即便是现在，256GB版本的iPhone XR也还能卖3799，算是手机里保值率最…

迅捷
2022年4月9日 • 投稿
联想平板截屏设置方法(联想截屏怎么截图)

在使用电脑的时候,可能会需要用到电脑截图功能来截取保存些重要文件资料.有些网友刚使用win10,不知道win10电脑怎么截图.下面小编就教下大家win10电脑截图的方法. 　　1.…

小多多
杂谈 2021年12月13日
杂谈

微信辅助解封一年几次怎么算的（微信解冻后恢复好友的方法）

微信是我们平时用来聊天交流、传送文件、购物时支付费用等的软件之一，微信给我们的生活带来了很多方便。如果在使用微信的过程中，出现了违规而被系统设置了限制登录时则无法使用。由于各种原因…

小多多
2021年12月13日
告急！超20国限制入境，变异毒株为何恐怖？钟南山最新研判！内蒙古确诊19例，多家A股公司发声

国内国外的疫情状况都不容乐观。

小多多
投稿 2021年11月29日