写一手好SQL，你该从哪里入手？-php黑洞网

本站消息

站长简介/公众号

出租广告位,需要合作请联系站长

gogogo

4067

文章

1881235

访问

+关注

分类

暂无分类

日期归档

2024-11(1)

写一手好SQL，你该从哪里入手？

发布于2021-03-14 06:19 阅读(1116) 评论(0) 点赞(16) 收藏(2)

有时候我们会遇到：在查询sql的时候，假如有100w条数据，会出现慢sql告警，这个时候你就应该到处sql日志来查找原因了。这里很有可能的主要原因就是没有命中索引和没有分页处理（原因有很多种，主要分析你的日志）。那接下来我们就得去优化sql了。

如何优化呢？下面我们来谈谈有关的问题。

一、从sql优化入手

谈到sql性能优化，那我们就离不开谈到大数据量和并发数，MySQL没有限制单表的最大记录数，它只是取决于操作系统对文件大小的限制。看表：

从表中我们可以看出，如果单表行数超过500万行或者单表容量超过2GB，才推荐分库分表。性能由综合因素决定，抛开业务复杂度，影响程度依次是硬件配置、MySQL配置、数据表设计、索引优化。500万这个值仅供参考，并非铁律。

假如你在操作过超过4亿行数据的单表，你可以用分页查询，分页查询最新的20条记录耗时0.6秒，SQL语句大致是select field_1,field_2 from table where id < #{prePageMinId} order by id desc limit 20，prePageMinId是上一页数据记录的最小ID。

这个查询出来的查询速度还凑合，不过随着数据不断增长，有朝一日必定不堪重负。所以分库分表是个周期长而风险高的大活儿，应该尽可能在当前结构上优化，比如升级硬件、迁移历史数据等等，实在没辙了再分。

最大并发数

并发数是指同一时刻数据库能处理多少个请求，由max_connections和max_user_connections决定。max_connections是指MySQL实例的最大连接数，上限值是16384，max_user_connections是指每个数据库用户的最大连接数。

MySQL会为每个连接提供缓冲区，意味着消耗更多的内存。如果连接数设置太高硬件吃不消，太低又不能充分利用硬件。一般要求两者比值超过10%，计算方法如下：

max_used_connections / max_connections * 100% = 3/100 *100% ≈ 3%

查看最大连接数与响应最大连接数如下：

show variables like '%max_connections%';
show variables like '%max_user_connections%';

在配置文件my.cnf中你可以修改最大连接数

[mysqld]
max_connections = 100
max_used_connections = 20

查询耗时0.5秒

建议将单次查询耗时控制在0.5秒以内，0.5秒是个经验值，源于用户体验的3秒原则。如果用户的操作3秒内没有响应，将会厌烦甚至退出。响应时间=客户端UI渲染耗时+网络请求耗时+应用程序处理耗时+查询数据库耗时，0.5秒就是留给数据库1/6的处理时间。

二、数据库设计也是影响性能的关键
数据类型的选择原则：更简单或者占用空间更小。你可以这样设计：
1 如果长度能够满足，整型尽量使用tinyint、smallint、medium_int而非int。
2 如果字符串长度确定，采用char类型。
3 如果varchar能够满足，不采用text类型。
4 精度要求较高的使用decimal类型，也可以使用BIGINT，比如精确两位小数就乘以100后保存。
5 尽量采用timestamp而非datetime。

相比datetime，timestamp占用更少的空间，以UTC的格式储存自动转换时区。

避免空值
MySQL中字段为NULL时依然占用空间，会使索引、索引统计更加复杂。从NULL值更新到非NULL无法做到原地更新，容易发生索引分裂影响性能。尽可能将NULL值用有意义的值代替，也能避免SQL语句里面包含is not null的判断。

text类型优化
由于text字段储存大量数据，表容量会很早涨上去，影响其他字段的查询性能。建议抽取出来放在子表里，用业务主键关联。

三、索引优化，这个经常谈到
索引的分类有哪些？
1 普通索引：最基本的索引
2 组合索引：多个字段上建立的索引，能够加速复合查询条件的检索。
3 唯一索引：与普通索引类似，但索引列的值必须唯一，允许有空值
4 组合唯一索引：列值的组合必须唯一
5 主键索引：特殊的唯一索引，用于唯一标识数据表中的某一条记录，不允许有空值，一般用primary key约束。
6 全文索引：用于海量文本的查询，MySQL5.6之后的InnoDB和MyISAM均支持全文索引。由于查询精度以及扩展性不佳，更多的企业选择Elasticsearch。

索引优化
1 分页查询很重要，如果查询数据量超过30%，MYSQL不会使用索引。
2 单表索引数不超过5个、单个索引字段数不超过5个。
3 字符串可使用前缀索引，前缀长度控制在5-8个字符。
4 字段唯一性太低，增加索引没有意义，如：是否删除、性别。

合理使用覆盖索引，如下所示：

select login_name, nick_name from member where login_name = ?

四，sql语句如何优化
业务描述：更新用户所有已过期的优惠券为不可用状态。

update status=0 FROM `coupon` WHERE expire_date <= #{currentDate} and status=1;

如果大量优惠券需要更新为不可用状态，执行这条SQL可能会堵死其他SQL，分批处理伪代码如下：

int pageNo = 1;
int PAGE_SIZE = 100;
while(true) {
    List<Integer> batchIdList = queryList('select id FROM `coupon` WHERE expire_date <= #{currentDate} and status = 1 limit #{(pageNo-1) * PAGE_SIZE},#{PAGE_SIZE}');
    if (CollectionUtils.isEmpty(batchIdList)) {
        return;
    }
    update('update status = 0 FROM `coupon` where status = 1 and id in #{batchIdList}')
    pageNo ++;
}

操作符<>优化
通常<>操作符无法使用索引，举例如下，查询金额不为100元的订单：

select id from orders where amount != 100;

如果金额为100的订单极少，这种数据分布严重不均的情况下，有可能使用索引。鉴于这种不确定性，采用union聚合搜索结果，改写方法如下：

(select id from orders where amount > 100)
 union all
(select id from orders where amount < 100 and amount > 0)

OR优化

在Innodb引擎下or无法使用组合索引，比如：

select id，product_name from orders where mobile_no = '13421800407' or user_id = 100;

OR无法命中mobile_no + user_id的组合索引，可采用union，如下所示：

(select id，product_name from orders where mobile_no = '13421800407')
 union
(select id，product_name from orders where user_id = 100);

此时id和product_name字段都有索引，查询才最高效。

IN优化

IN适合主表大子表小，EXIST适合主表小子表大。由于查询优化器的不断升级，很多场景这两者性能差不多一样了。
尝试改为join查询，举例如下：

select id from orders where user_id in (select id from user where level = 'VIP');

采用JOIN如下所示：

select o.id from orders o left join user u on o.user_id = u.id where u.level = 'VIP';

不做列运算

通常在查询条件列运算会导致索引失效，如下所示：
查询当日订单

select id from order where date_format(create_time，'%Y-%m-%d') = '2019-07-01';

date_format函数会导致这个查询无法使用索引，改写后：

select id from order where create_time between '2019-07-01 00:00:00' 
and '2019-07-01 23:59:59';

避免Select all

如果不查询表中所有的列，避免使用SELECT *，它会进行全表扫描，不能有效利用索引。

Like优化

like用于模糊查询，举个例子（field已建立索引）：

SELECT column FROM table WHERE field like '%keyword%';

这个查询未命中索引，换成下面的写法：

SELECT column FROM table WHERE field like 'keyword%';

去除了前面的%查询将会命中索引，但是产品经理一定要前后模糊匹配呢？全文索引fulltext可以尝试一下，但Elasticsearch才是终极武器。

Join优化

join的实现是采用Nested Loop Join算法，就是通过驱动表的结果集作为基础数据，通过该结数据作为过滤条件到下一个表中循环查询数据，然后合并结果。如果有多个join，则将前面的结果集作为循环数据，再次到后一个表中查询数据。
驱动表和被驱动表尽可能增加查询条件，满足ON的条件而少用Where，用小结果集驱动大结果集。
被驱动表的join字段上加上索引，无法建立索引的时候，设置足够的Join Buffer Size。
禁止join连接三个以上的表，尝试增加冗余字段。

Limit优化

limit用于分页查询时越往后翻性能越差，解决的原则：缩小扫描范围，如下所示：

select * from orders order by id desc limit 100000,10

耗时0.4秒

select * from orders order by id desc limit 1000000,10

耗时5.2秒

先筛选出ID缩小查询范围，写法如下：

select * from orders where id > (select id from orders order by id desc  
limit 1000000, 1) order by id desc limit 0,10

耗时0.5秒
如果查询条件仅有主键ID，写法如下：

select id from orders where id between 1000000 and 1000010 order by id desc

耗时0.3秒

如果以上方案依然很慢呢？只好用游标了。

对PHP后端技术，对PHP架构技术感兴趣的朋友，我的官方群1023755567点击此处，一起学习，相互讨论。
群内已经有管理将知识体系整理好（源码，学习视频等资料），欢迎加群免费领取。

PHP进阶学习思维导图、面试；文档、视频资源免费获取

所属网站分类: 技术文章 > 博客

作者：gogogo

链接：http://www.phpheidong.com/blog/article/3156/ae64fa40354d71b0fc40/

来源：php黑洞网

任何形式的转载都请注明出处,如有侵权一经发现必将追究其法律责任

16 0

收藏该文

昵称:

评论内容：(最多支持255个字符)

---无人问津也好，技不如人也罢，你都要试着安静下来，去做自己该做的事，而不是让内心的烦躁、焦虑，坏掉你本来就不多的热情和定力

程序员的那些事(new)

程序员接单当渠道

数据结构--排序

※ 去年我年薪 30W，今年我一天做 3 顿饭

面试中的常见骗局

记最近一周的一个支线任务

搬砖问钱程，蜻蜓点水行不行？

【思维导图】富士低焦段定焦镜头选择

QT：QSS样式实用集合

数组的排序（冒泡排序）

从一个月2500没人要到大厂技术主管的编程之路|我的十年

电子书(new)

PHP Cookbook：PHP程序员的解决方案和示例 pdf

PHP核心技术与最佳实践 pdf

PHP高级程序设计：模式，框架与测试 pdf

PHP程序设计 pdf

PHP精粹：编写高效的PHP代码 pdf

深度PHP：面向对象，模式与实践（第2版）pdf

PHP与MySQL 5程序设计（第2版） pdf

搜索引擎优化高级编程：使用PHP进行专业搜索引擎优化 pdf

PHP和MySQL Web开发（原书第4版）pdf下载

现代PHP（中文版）pdf下载

脚本(new)

用PHP创建的在线寻宝游戏

保龄球游戏卡塔使用PHP和PHPUnit

一个用php编写的国际象棋游戏

使用PHP后端的实时多人游戏

基于PHP的在线寻宝游戏

jQuery和PHP扑克游戏

PHP德州扑克游戏

PHP中的保龄球游戏Kata

在线角色扮演游戏

由PHP IRC机器人提供支持的热门狼人游戏（黑手党的变种）

博客(new)

打包部署若依(RuoYi)SpringBoot后端和Vue前端图文教程

MS SQL Server 实战统计与汇总重复记录

MySQL中的增查操作：探索数据的奥秘，开启数据之门

[SpringBoot] 苍穹外卖--面试题总结--上

【MySQL】窗口函数详解（概念+练习+实战）

Spring中的@Autowired注解：深入解析与实战指南

MySQL 读写分离

【随时随地学算法】本地部署hello-algo结合内网穿透远程学习新体验

解锁MySQL的潜力：掌握修改、删除和约束的关键技巧

2019年系统架构师案例分析试题五

视频教程(new)

正则表达式极速入门

php从零开始开发属于自己的php框架

Thinkphp3.2.3个人博客开发

ThinkPHP5快速开发企业站点[全程实录]

ThinkPHP5实战之[教学管理系统]

PHP视频教程

ThinkPHP5视频教程

CI框架30分钟极速入门

PHP实战微信支付视频教程

PHP实战仿爱奇艺电影网站，视频教程

项目实战(new)

PHP发送邮件功能

PHP注册时短信通知功能

smarty模板引擎[函数篇]

PHP制作阴阳历转换的日历插件

PHP项目开发案例全程实录视频及源码

PHP 发表评论功能实战教程

布尔教育Blog项目实战视频教程

Yii2框架搭建完整博客系统

Laravel5.2博客实战视频教程

Thinkphp3.2.3个人博客开发实战

问答(new)

PHP 代码未执行，但代码显示在浏览器源代码中

PHP 中使用数字字符串作为数组键

当令牌无效时，向 iOS 设备推送通知失败

CORS 中间件在预检 OPTIONS 请求上运行，但不在主请求上运行

在 opencart 的“主页”或“索引页”上随机显示产品

裁剪并上传 PNG 文件会导致文件无法读取

如何将 HTML 代码作为 URL 的输入（使用 $_REQUEST）

如何获取表格中选定的值

使用加密密码自定义登录 joomla

Ajax - 多次调用会减慢我的服务器速度

游戏(new)

Conway的PHP生活游戏

用PHP和JavaScript编写的UNO游戏

国际象棋游戏-php

php贪吃蛇游戏-源码下载

一个基于PHP的在线足球游戏

PHP小游戏-进击吧战士

php小游戏源码下载

php斗地主游戏

php贪吃蛇游戏源码下载

PHP玩微信跳一跳，源码下载

其他资源(new)

PHP函数string字符串函数视频讲解

php开发验证码最新视频教程

PHP函数之array数组函数视频讲解

PHP模糊查询技术视频教程

php新闻发布系统视频教程

PHP留言板制作经典视频教程

PHP学生管理系统视频教程

PHP入门视频教程之一周学会PHP

命名空间30分钟极速入门

PHP字符串操作经典入门

分类

标签

日期归档

写一手好SQL，你该从哪里入手？