sql分区原理(分区表场景下的 SQL 优化)
sql分区原理
分区表场景下的 SQL 优化导读
有个表做了分区,每天一个分区。
该表上有个查询,经常只查询表中某一天数据,但每次都几乎要扫描整个分区的所有数据,有什么办法进行优化吗?
待优化场景
有一个大表,每天产生的数据量约100万,所以就采用表分区方案,每天一个分区。
下面是该表的DDL:
CREATE TABLE `t1` ( `id` bigint(20) NOT NULL AUTO_INCREMENT, `date` date NOT NULL, `kid` int(11) DEFAULT '0', `uid` int(11) NOT NULL, `iid` int(11) DEFAULT '0', `icnt` int(8) DEFAULT '0', `tst` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP, `countp` smallint(11) DEFAULT '1', `isr` int(2) NOT NULL DEFAULT '0', `clv` int(5) NOT NULL DEFAULT '1', PRIMARY KEY (`id`,`date`), UNIQUE KEY `date` (`date`,`uid`,`iid`), KEY `date_2` (`date`,`kid`) ) ENGINE=InnoDB AUTO_INCREMENT=3180686682 DEFAULT CHARSET=utf8mb4 /*!50500 PARTITION BY RANGE COLUMNS(`date`) (PARTITION p20161201 VALUES LESS THAN ('2016-12-02') ENGINE = InnoDB, PARTITION p20161202 VALUES LESS THAN ('2016-12-03') ENGINE = InnoDB, PARTITION p20161203 VALUES LESS THAN ('2016-12-04') ENGINE = InnoDB,
该表上经常发生下面的慢查询:
SELECT ... FROM `t1` WHERE `date` = '2017-04-01' AND `icnt` > 300 AND `id` = '801301';
SQL优化之路
SQL优化思路
想要优化一个SQL,一般来说就是先看执行计划,观察是否尽可能用到索引,同时要关注预计扫描的行数,以及是否产生了临时表(Using temporary) 或者 是否需要进行排序(Using filesort),想办法消除这些情况。
更进一步的优化策略则可能需要调整程序代码逻辑,甚至技术架构或者业务需求,这个动作比较大,一般非核心系统上的核心问题,不会这么大动干戈,绝大多数情况,还是需要靠DBA尽可能发挥聪明才智来解决。
SQL性能瓶颈定位
现在,我们来看下这个SQL的执行计划:
yejr@imysql.com[myDB]> EXPLAIN PARTITIONS SELECT ... FROM `t1` WHERE `date` = '2017-03-02' AND `icnt` > 100 AND `iid` = '502302'\G *************************** 1. row *************************** id: 1 select_type: SIMPLE table: t1 partitions: p20170302 type: range possible_keys: date,date_2 key: date key_len: 3 ref: const rows: 9384602 Extra: Using where
这个执行计划看起来还好,有索引可用,也没临时表,也没filesort。不过,我们也注意到,预计要扫描的行数还是挺多的 rows: 9384602,而且要扫描zheng整个分区的所有数据,难怪效率不高,总是SLOW QUERY。
优化思考
我们注意到这个SQL总是要查询某一天的数据,这个表已经做了按天分区,那是不是可以忽略 WHERE 子句中的 时间条件呢?
还有,既然去掉了 date 条件,反观表DDL,剩下的条件貌似就没有合适的索引了吧?
所以,我们尝试新建一个索引:
yejr@imysql.com[myDB]> ALTER TABLE t1 ADD INDEX iid (iid, icnt);
然后,把SQL改造成下面这样,再看下执行计划:
yejr@imysql.com[myDB]> EXPLAIN PARTITIONS SELECT ... FROM `t1` partition(p2017030) WHERE `icnt` > 100 AND `iid` = '502302'\G *************************** 1. row *************************** id: 1 select_type: SIMPLE table: t1 partitions: p20170302 type: ref possible_keys: date,date_2,iid key: iid key_len: 10 ref: const rows: 7800 Extra: Using where 这优化效果,杠杠滴。 事实上,如果不强制指定分区的话,也是可以达到优化效果的: yejr@imysql.com[myDB]> EXPLAIN PARTITIONS SELECT ... FROM `t1` WHERE `date` = '2017-03-02' AND `icnt` > 100 AND `iid` = '502302'\G *************************** 1. row *************************** id: 1 select_type: SIMPLE table: t1 partitions: p20170302 type: ref possible_keys: date,date_2,iid key: iid key_len: 10 ref: NULL rows: 7800 Extra: Using where
后记
绝大多数的SQL通过添加索引、适当调整SQL代码(例如调整驱动表顺序)等简单手法来完成。
多说几句,遇到SQL优化性能瓶颈问题想要在技术群里请教时,麻烦先提供几个必要的信息:
- 表DDL
- 表常规统计信息,可执行 SHOW TABLE STATUS LIKE ‘t1' 查看
- 表索引分布信息,可执行 SHOW INDEX FROM t1 查看
- 有问题的SQL及相应的执行计划 没有这些信息的话,就别去麻烦别人了吧。
以上就是分区表场景下的 SQL 优化的详细内容,更多关于sql分区表优化的资料请关注开心学习网其它相关文章!
- mysql游标的使用(MySQL 游标的作用与使用相关)
- SQL Server 批量导入数据的方法
- mysql3种日志(mysql中的7种日志小结)
- mysql的innodb设置(修改MySQL数据库引擎为InnoDB的操作)
- mysql三种查询方式(MySQL查询学习之基础查询操作)
- docker搭建mysql服务(Docker部署Mysql集群的实现)
- sqlserver2008手动备份方法(MSSQL 2008 自动备份数据库的设置方法)
- mysql查看执行慢的sql(系统隐形杀手——阻塞与等待SQL)
- mysql语句性能分析(聊聊MySQL的COUNT*的性能)
- mysql查询逗号分割字符串(MySQL 字符串拆分实例无分隔符的字符串截取)
- mysqlnull所占空间(详解mysql三值逻辑与NULL)
- SQL Server数据库备份的几个建议
- windows mysql 忘记密码(解决MySQL忘记密码问题的方法)
- sql server 新函数(SQL Server分隔函数实例详解)
- mysql left join索引怎么使用(详解mysql 使用left join添加where条件的问题分析)
- sql server修改sa密码(sqlserver添加sa用户和密码的实现)
- 春节放假几天(春节放假几天2023法定几天)
- 今天 3月13日,31年前,一个英雄少年感动了中国(今天3月13日31年前)
- 你好,新成理人丨成都理工大学2019级新生开学典礼隆重举行(新成理人丨成都理工大学2019级新生开学典礼隆重举行)
- 这部民警编演的红色话剧,讲述了一个不断追寻的故事(这部民警编演的红色话剧)
- 日本菜有什么好吃(日本菜有什么好吃的做法)
- 韩国泡菜做法(韩国泡菜的做法步骤)
热门推荐
- setTimeout和setIntelval的用法和区别
- 正则表达式在python的中的应用(Python中正则表达式的用法总结)
- dedecms怎么添加栏目(Dedecms频道,列表页,内容页中调用全站最新文章的方法)
- jquery滚动固定插件在哪(jquery 步骤进度轴插件的实现代码)
- css3结合js制作(CSS3截取字符串实例代码推荐)
- pandas读取excel数据教程(详解pandas库pd.read_excel操作读取excel文件参数整理与实例)
- mysql关联查询详解(详解mysql 组合查询)
- 如何采集nginx的日志(Filebeat 采集 Nginx 日志的方法)
- mysqlupdate原理(MySQL UPDATE 语句的非标准实现代码)
- 浏览器加载网页的顺序
排行榜
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9