表索引怎么弄（论文图表索引制作方法）

小多多 • 2021年12月13日下午8:36 • 杂谈

表的主键指的针对一张表中的一列或者多列，其结果必须能标识表中每行记录的唯一性。InnoDB 表是索引组织表，主键既是数据也是索引。

主键的设计原则

1. 对空间占用要小

上一篇我们介绍过 InnoDB 主键的存储方式，主键占用空间越小，每个索引页里存放的键值越多，这样一次性放入内存的数据也就越多。

2. 最好是有一定的排序属性

如 INT32 类型来做主键，数值有严格的排序，那新记录的插入只要往原先数据页后面添加新记录或者在数据页后新增空页来填充记录即可，这样有严格排序的主键写入速度也会非常快。

3. 数据类型为整形

数据类型早就已经讲过，按照前两点的需求，最理想的当然是选择整数类型，比如 int32 unsigned。数据顺序增长，要么是数据库自己生成，要么是业务自动生成。

一、与业务无关的属性做主键

1.1 自增字段做主键

这是 MySQL 最推荐的方式。一般用 INT32 可以满足大部分场景，单库单表可以最大保存 42 亿行记录；含有自增字段的新增记录会顺序添加到当前索引节点的后续位置直到数据页写满为止，再写新页。这样会极大程度地减少数据页的随机 IO。

用自增字段做主键可能需要注意两个问题：

第一个问题：MySQL 原生自增键拆分

如果随着数据后期增长，有拆库拆表预期，可以考虑用 INT64；MySQL 原生支持拆库拆表的自增主键，通过自增步长与起始值来确定。最少要有 2 个 MySQL 节点，每个节点自增步长为 2，假设 server_id 分别为 1，2，那自增起始值也可以是 1，2。假设下面是第 1 个 MySQL 节点，设置好了步长和起始值后，表 tmp 插入三行，每行严格按照设置的方式插入数据。

mysql>set@@auto_increment_increment=2;QueryOK,0rowsaffected(0.00sec)mysql>set@@auto_increment_offset=1;QueryOK,0rowsaffected(0.00sec)mysql>insertintotmpvalues(null),(null),(null);QueryOK,3rowsaffected(0.01sec)Records:3Duplicates:0Warnings:0mysql>select*fromtmp;+----+|id|+----+|1||3||5|+----+3rowsinset(0.00sec)

但是这块 MySQL 并不能保证其他的值不冲突，比如插入一条节点 2 的值，也能成功插入，MySQL 默认对这块没有什么约束，最好是数据入库前就校验好。

mysql>insertintotmpvalues(2);QueryOK,1rowaffected(0.02sec)mysql>select*fromtmp;+----+|id|+----+|1||2||3||5|+----+4rowsinset(0.00sec)

第二个问题：MySQL 自增键合并

这个问题一般牵扯到老的系统改造升级，比如多个分部老系统数据要向新系统合并，那之前每个分部的自增主键不能简单地合并，可能会有主键冲突。举个例子，假设武汉市每个区都有自己的医保数据，并且以前每个区都是自己独立设计的数据库，现在医保要升级为全市统一，以市为单位设计新的数据库模型。

武昌的数据如下，对应表 n1，

mysql>select*fromn1;+----+|id|+----+|1||2||3|+----+3rowsinset(0.00sec)

汉阳的数据如下，对应表 n2，

mysql>select*fromn2;+----+|id|+----+|1||2||3|+----+3rowsinset(0.00sec)

由于之前两个区数据库设计的人都没有考虑以后合并的事情，所以每个区的表都有自己独立的自增主键，

考虑这样建立一张汇总表 n3，有新的自增 ID，并且设计导入老系统的 ID。

mysql>createtablen3(idintauto_incrementprimarykey,old_idint);QueryOK,0rowsaffected(0.07sec)mysql>insertinton3(old_id)select*fromn1unionallselect*fromn2;QueryOK,6rowsaffected(0.01sec)Records:6Duplicates:0Warnings:0mysql>select*fromn3;+----+--------+|id|old_id|+----+--------+|1|1||2|2||3|3||4|1||5|2||6|3|+----+--------+6rowsinset(0.00sec)

这样进行汇总，应用代码可能不太确定怎么连接老的数据，这张表缺少一个 old_id 到原始表名的映射。

那基于原始表 ID 与原始表名的映射关系建立一个多值索引。比如以下例子：

mysql>createtablen4(old_idint,old_namevarchar(64),primarykey(old_id,old_name));QueryOK,0rowsaffected(0.05sec)mysql>insertinton4selectid,\'n1\'fromn1unionallselectid,\'n2\'fromn2;QueryOK,6rowsaffected(0.02sec)Records:6Duplicates:0Warnings:0mysql>select*fromn4;+--------+----------+|old_id|old_name|+--------+----------+|1|n1||1|n2||2|n1||2|n2||3|n1||3|n2|+--------+----------+6rowsinset(0.00sec)

最终表结构，结合前面两张表 n3 和 n4，建立一个包含新的自增字段主键，原来表 ID，原来表名的新表：

create table n5(idintunsignedauto_incrementprimarykey,old_idint,old_namevarchar(64),uniquekeyudx_old_id_old_name(old_id,old_name));

当然，关于数据汇总迁移的话题，讨论篇幅太长，不在本节范围。

1.2 UUID 做主键

UUID 和自增主键一样，能保证主键的唯一性。但是天生无序、随机产生、占用空间大。在 MySQL 里，用 char(36) 来存储 UUID，没有专门的 UUID 数据类型，类似这样的字符串: ‘7985847c-7d59-11ea-8add-080027c52750’。由于 InnoDB 表的特性，应该避免用 char(36) 保存原始 UUID 的方式做表主键。

虽然 UUID 无序，且存在空间浪费，但天生随机这个优点能否利用上？

MySQL 提供了以下的优化方法来让原始 UUID 可以被用于表主键：

函数 uuid_to_bin

MySQL 提供了函数 uuid_to_bin，把 UUID 字符串变为 16 个字节的二进制串。类似于某些数据库（比如 POSTGRESQL）的 UUID 类型。函数 uuid_to_bin 返回数据类型为 varbinary(16)。

例如表 t_binary，

mysql>createtablet_binary(idvarbinary(16)primarykey,r1int,keyidx_r1(r1));QueryOK,0rowsaffected(0.07sec)mysql>insertintot_binaryvalues(uuid_to_bin(uuid()),1),(uuid_to_bin(uuid()),2);QueryOK,2rowsaffected(0.01sec)Records:2Duplicates:0Warnings:0mysql>select*fromt_binary;+------------------------------------+------+|id|r1|+------------------------------------+------+|0x412234A77DEF11EA9AF9080027C52750|1||0x412236E27DEF11EA9AF9080027C52750|2|+------------------------------------+------+2rowsinset(0.00sec)

函数 uuid_short

varbinary(16) 依然是无序的，为此 MySQL 还提供了一个函数 uuid_short，用来生成类似 UUID 的全局 ID，结果为 INT64。具体计算方式如下：

(server_id & 255) << 56 + (server_startup_time_in_seconds << 24) + incremented_variable++;

server_id & 255：占 1 个字节；
server_startup_time_in_seconds：占 4 个字节；
incremented_variable: 占 3 个字节。

如果满足以下条件，那这个值就必定是唯一的

1. server_id 唯一并且对函数 uuid_short() 的调用次数不超过每秒 16777216 次，也就是 2^24。所以一般情况下，uuid_short 函数能保证结果唯一。

2. uuid_short 函数生成的 ID 只需一个轻量级的 mutex 来保护，这点比自增 ID 需要的 auto-inc 表锁更省资源，生成结果肯定更加快速。

下面表 t_uuid_short 演示了如何用这个函数。

mysql>createtablet_uuid_short(idbigintunsignedprimarykey,r1int,keyidx_r1(r1));QueryOK,0rowsaffected(0.06sec)mysql>insertintot_uuid_shortvalues(uuid_short(),1),(uuid_short(),2)QueryOK,2rowsaffected(0.02sec)Records:2Duplicates:0Warnings:0mysql>select*fromt_uuid_short;+----------------------+------+|id|r1|+----------------------+------+|16743984358464946177|1||16743984358464946178|2|+----------------------+------+2rowsinset(0.00sec)

可以看到 uuid_short 生成的数据是基于 INT64 有序的，所以这块可以看做是自增 ID 的一个补充优化，如果每秒调用次数少于 16777216，推荐用 uuid_short，而非自增 ID。

说了那么多，还是简单验证下上面的结论，做个小实验。

以下实验涉及到四张表：

新建 t_uuid: uuid 为主键
表 t_binary：varbinary(16) 为主键
表 t_uuid_short：bigint 为主键
新建表 t_id：自增 ID 为主键

正如之前的预期，写性能差异按从最差到最好排列依次为：t_uuid; t_binary；t_id；t_uuid_short。我们来实验下是否和预期相符。

新增的两张表结构：

mysql>createtablet_uuid(idchar(36)primarykey,r1int,keyidx_r1(r1));QueryOK,0rowsaffected(0.06sec)mysql>createtablet_id(idbigintauto_incrementprimarykey,r1int,keyidx_r1(r1));QueryOK,0rowsaffected(0.08sec)

简单写了一个存储过程，分别给这些表造 30W 条记录。

DELIMITER$$CREATEPROCEDURE`ytt`.`sp_insert_data`(f_tbnameVARCHAR(64),f_numberINTUNSIGNED)BEGINDECLAREiINTUNSIGNEDDEFAULT0;SET@@autocommit=0;IFf_tbname=\'t_uuid\'THENSET@stmt=CONCAT(\'insertintot_uuidvalues(uuid(),ceil(rand()*100));\');ELSEIFf_tbname=\'t_binary\'THENSET@stmt=CONCAT(\'insertintot_binaryvalues(uuid_to_bin(uuid()),ceil(rand()*100));\');ELSEIFf_tbname=\'t_uuid_short\'THENSET@stmt=CONCAT(\'insertintot_uuid_shortvalues(uuid_short(),ceil(rand()*100));\');ELSEIFf_tbname=\'t_id\'THENSET@stmt=CONCAT(\'insertintot_id(r1)values(ceil(rand()*100));\');ENDIF;WHILEi<f_numberDOPREPAREs1FROM@stmt;EXECUTEs1;SETi=i+1;IFMOD(i,50)=0THENCOMMIT;ENDIF;ENDWHILE;COMMIT;DROPPREPAREs1;SET@@autocommit=1;END$$DELIMITER;

接下来分别调用存储过程，结果和预期一致。t_uuid 时间最长，t_uuid_short 时间最短。

mysql>callsp_insert_data(\'t_uuid\',300000);QueryOK,0rowsaffected(5min23.33sec)mysql>callsp_insert_data(\'t_binary\',300000);QueryOK,0rowsaffected(4min48.92sec)mysql>callsp_insert_data(\'t_id\',300000);QueryOK,0rowsaffected(3min40.38sec)mysql>callsp_insert_data(\'t_uuid_short\',300000);QueryOK,0rowsaffected(3min9.94sec)

二、与业务有关的属性做主键。

主键的设计要求可读性很强，类似学生学号（入学年份+所属系+所读专业），购物订单编码等。其实非常不建议主键用这样有实际意义的业务字段。可以新建一个自增主键或者 uuid_short() 函数字段，实际业务字段非主键设计，变为普通唯一索引。比如表 n5：

mysql>createtablen5(idintunsignedauto_incrementprimarykey,usernointunsigned,uniquekeyudx_userno(userno));QueryOK,0rowsaffected(0.08sec)

用 userno（用户编码）来做主键，如果在业务端数据已经错误，比如可能由于老师原因录入错误数据，或者是业务系统的 BUG 导致录入数据有误，那不仅要对录入表的主键做更改（这可是聚簇索引），还要更改依赖这张表的所有子表，这其实是一个很大的工程。但是如果有与业务不相关的主键，只需要更改业务字段（二级索引）就可以，不需要更改依赖这张表的子表。

关于 MySQL 主键的设计思路大致介绍到此，有问题欢迎留言，欢迎指正本篇任何不足之处。

小多多创始人

0 0

哪里的蝶尾金鱼品质好（蝶尾反翘是什么意思）

江苏的蝶尾金鱼品质比较好。这种鱼的饲养方法和其它的金鱼不一样，首先它要求水面要大，同时水位不能太高，水流的速度要缓慢，平时喂食也不能太多，最好全天给它充氧，保证它的呼吸。这种鱼的眼…

小多多
杂谈 2021年12月13日
做自媒体拍摄视频设备(拍摄视频脚本怎么写门店)

1.主题。摄影顺序是根据不同的场景安排摄影顺序，例如，视频同一场景在不同的时间多次出现，摄影时尽量拍摄同一场景的内容，以免重复场所浪费时间和人力。 4.气氛摄影氛围是指理想的境…

小多多
杂谈 2021年12月13日
杂谈

水果生鲜类抖音号被大量封号

最近松松编辑杰哥了解到，抖音最近开启大范围封禁账号行动，清理了一大批打着打着卖惨旗号，实则演戏欺骗用户的抖音水果生鲜带货账号。难以想象，现在的网络水太深了，到处都是套路啊! 抖音对…

小多多
2021年12月13日
房管所改制后叫什么

房管所也叫房管局，是政府单位，主要是负责公房的管理、房租收缴、修缮改造行政机构，现在已经不交房管局了，已经合并进住房和城乡建设局，成为其下属科室的房管科部门。房管所改制后叫什么 …

季候
杂谈 2022年4月6日
杂谈

在家就业的工作推荐(在家上班的工作有什么)

来势汹汹的新冠疫情对人们的工作和生活造成了严重影响，即使疫情减轻影响依然会长期存在。疫情史无前例地提升了工作中人际接触的重要性，进而改变了劳动力发展趋势。麦肯锡全球研究院（MGI）…

小多多
2021年12月13日
杂谈

但还没有那么夸张(上市公司独董离职潮苗头初显)

又有多家上市公司出现独立董事辞职。一晚上5家A股公司独董辞职截至晚间发稿，11月19日A股共有5家上市公司发布独董辞职公告，包括金花股份(600080)、科新发展(600234…

小多多
2021年12月13日
连接设备平台服务有什么用（台式电脑连网络教程）

此账号为华为云开发者社区官方运营账号，提供全面深入的云计算前景分析、丰富的技术干货、程序样例，分享华为云前沿资讯动态本文分享自华为云社区《【…

小多多
2021年12月13日 • 杂谈
小斑鸠要不要喂水（斑鸠身上有哪些病毒）

野生斑鸠幼崽需要喂熟玉米粒，最好将其切碎一点，以免不利于吞咽。也可以买一点鸽乳，加水团城小球进行喂养，每次要喂到嗉囊鼓起来，然后加点水帮助消化。这种鸟通常在山地和平原的林区栖息，秋…

小多多
杂谈 2021年12月13日
省呗风险评估保障有用吗

省呗风险评估保障还是很有用的，因为省呗是在风险控制上很有经验，建立完善可靠的监控体系，信息安全保障达到了银行的风险安全等级，是很有保障的金融支付软件。省呗风险评估保障有用吗省呗…

季候
杂谈 2022年4月6日
哪个驱动软件最好不收费不限速（360驱动大师良心软件）

软件名称：360驱动大师软件特点：干净清爽、安装和使用过程中没有弹窗和捆绑软件。适用系统：Windows 见过无数小白的电脑，系统和网速巨卡，打开页面像是放幻灯片，弹窗广告一大…

季候
2022年4月8日 • 杂谈
杂谈

微信号要养多久才稳定（微信小号干嘛用的）

一、新注册的微信号养号注意事项新注册好的微信号切记不要马上用来加人，以及使用摇一摇、附近的人功能等，新号使用需注意以下几点：1、注册微信号后，不要马上去使用LBS（地理位置）。不要…

小多多
2021年12月10日
js复选框是否选中（设置按钮无边框的方法）

今天跟大家写了一份js的联动全选的源码，代码少，清晰易懂。效果是这样的：点击全选下面的就会被全部全选，或者下面的被一一选择，全选按钮也会被选中。运用复选框来实现的联动全选的功能…

小多多
杂谈 2021年12月13日
抖音大数据（抖音平台用户大数据图）

【亿邦动力讯】1月6日消息，抖音今日披露一组2019年大数据，对过去一年抖音平台上的视频内容进行统计分析。数据显示，2019年1月，抖音日活跃用户数为2.5亿，2019年7月为3.…

小多多
2021年12月10日 • 杂谈
语音云服务网站（微信语音播放失败恢复正常）

12月23日，国际权威研究机构IDC发布《中国AI云服务市场半年度研究报告，2020H1》。报告显示，得益于对达摩院的长期投入，阿里AI在各技术领域增长迅猛，尤其在语音语言领域表现…

小多多
杂谈 2021年12月13日
正规的可以提现的游戏推荐(能直接提现的手机游戏软件)

国家一直在加强力度严打诈骗、虚假广告，但那些只消耗了用户时间和精力而没有让用户损失钱的手机小游戏却遍地开花，无人管理。而受害的用户因为没有金钱损失也不过多追究，顶多算是踩了个坑。 …

小多多
杂谈 2021年12月13日

发表回复

登录后才能评论

表索引怎么弄（论文图表索引制作方法）

相关推荐

发表回复