SQL进阶

Wesley13
• 阅读 505

一、索引设置

1、索引的设置原则

经常出现在WHERE条件、关联条件中的字段作为索引字段;

在满足查询需求的前提下,应尽可能少的创建索引;(对于一个组合索引,可以满足以组合索引左边的一部分字段的查询需求);

经常更新的字段,不适合创建索引;

区分度太低的字段,不适合创建索引;

不要为永远不会出现在WHERE条件、关联条件中的字段创建索引;

2、案例分析

比如有下面一张表:

SQL进阶

查询需求如下:

需求一:按单个客户编号查询某个客户的交易明细。

需求二:按单个客户编号查询某个时间段的某只股票的交易明细。

需求三:统计某个时间段每只股票不同交易类型的交易金额。

需求四:统计每天所有股票的交易金额。

需求五:统计每只股票所有的交易费用。


查询一:SELECT * FROM stock_trans_detail WHERE customer_id = '?';

查询二:SELECT * FROM stock_trans_detail WHERE customer_id = '?' AND trans_date BETWEEN '2020-01-01' AND '2020-12-31' AND stock_code = '?';

查询三:SELECT stock_code,trans_type,sum(price*volume) FROM stock_trans_detail WHERE trans_date BETWEEN '2020-01-01' AND '2020-12-31' GROUP BY stock_code,trans_type;

查询四:SELECT trans_date,sum(price*volume) FROM stock_trans_detail GROUP BY trans_date;

查询五:SELECT stock_code,sum(fee) FROM stock_trans_detail GROUP BY stock_code;

索引设置分析:

需求一:按单个客户编号查询某个客户的交易明细。
需求二:按单个客户编号查询某个时间段的某只股票的交易明细。
需求三:统计某个时间段每只股票不同交易类型的交易金额。
需求四:统计每天所有股票的交易金额。
需求五:统计每只股票所有的交易费用。


索引一:customer_id
索引二:customer_id,trans_date,stock_code
索引三:trans_date,stock_code
索引四:无
索引五:无

最终:
索引一:customer_id,trans_date,stock_code
索引二:trans_date,stock_code

二、SQL优化

1、SQL优化的五个层次

SQL进阶

SQL进阶

主键 –> 唯一索引 –> 非唯一索引 –> 全表扫描(应尽量避免)

2、SQL优化的15条铁律

铁律1:尽量避免在索引列上使用表达式

如:
SELECT * FROM score WHERE score / 100 >= 0.6;
转换为:
SELECT * FROM score WHERE score >= 0.6 * 100;


SELECT * FROM score WHERE LEFT(student_id,1) = 'S';
转换为:
SELECT * FROM score WHERE student_id LIKE 'S%';

铁律2:尽量避免在WHERE条件中使用NOT、<>和!=操作符

如:
SELECT * FROM score WHERE score <> 50;
转换为:
SELECT * FROM score WHERE score > 50 OR score < 50;
或
SELECT * FROM score WHERE score > 50;
UNION ALL
SELECT * FROM score WHERE score < 50;

铁律3:避免索引列的隐式类型转换

如:
SELECT * FROM stock_trans_detail WHERE stock_code = 600001;
转换为:
SELECT * FROM stock_trans_detail WHERE stock_code = '600001';

铁律4:在OR的两个条件上都有索引的话,将OR转换为UNION或UNION ALL

如:
SELECT * FROM score WHERE score = 100 OR gender = '男';
转换为:
SELECT * FROM score WHERE score = 100 
UNION
SELECT * FROM score WHERE gender = '男';

铁律5:使用IN操作符替换OR

如:
SELECT * FROM score WHERE score = 100 OR score = 99;
转换为:
SELECT * FROM score WHERE score IN (100,99);

铁律6:使用BETWEEN操作符替换IN

如:
SELECT * FROM score WHERE score IN (100,99,98,97,96,95);
转换为:
SELECT * FROM score WHERE score BETWEEN 95 AND 100;

铁律7:在合适的情况下,使用EXISTS操作符替换IN

如:
SELECT * FROM stock 
WHERE stock_code IN (
SELECT stock_code FROM stock_trans_detail
WHERE trans_date BETWEEN '2020-01-01' AND '2020-12-31'
);
转换为:
SELECT * FROM stock a
WHERE EXISTS (
SELECT 1 FROM stock_trans_detail b
WHERE a.stock_code = b.stock_code
AND b.trans_date BETWEEN '2020-01-01' AND '2020-12-31'
);


子查询结果集较大时,适合用EXISTS;
子查询结果集较小时,适合用IN;

铁律8:LIKE通配符也可能导致索引失效

如:
SELECT * FROM score WHERE subject_name LIKE '%机%';
转换为:
SELECT * FROM score WHERE subject_name LIKE '机%'
UNION ALL
SELECT * FROM score WHERE subject_name LIKE '计算机%';
或
SELECT * FROM score 
WHERE subject_name IN ('机械原理','计算机导论');

铁律9:索引中不包含NULL值,所以使用IS NULL、IS NOT NULL做判断的条件,都用不到索引

解决方法:应该将数据库中的所有字段都设置为不可为NULL,且针对不同的数据类型设置默认值。
比如,对于INT类型的字段,如果为NULL,则设为默认值0。这样就可以将IS NULL的判断,转换为与0相等的判断。

如:
SELECT * FROM score WHERE score IS NULL;
转换为:
SELECT * FROM score WHERE score = 0;

铁律10: INT型字段中,应该使用>=替换>

如:
SELECT * FROM student WHERE age > 15;
转换为:
SELECT * FROM student WHERE age >= 16;

铁律11: 在多个结果集不交叉的情况下,使用UNION ALL替换UNION

如:
SELECT * FROM score WHERE score = 100 
UNION
SELECT * FROM score WHERE score = 99;
转换为:
SELECT * FROM score WHERE score = 100 
UNION ALL
SELECT * FROM score WHERE score = 99;

铁律12: 优化GROUP BY子句

如:
SELECT trans_date,stock_code,sum(volume) 
FROM stock_trans_detail
GROUP BY trans_date,
CASE WHEN trans_type = 'B' THEN '买入' WHEN trans_type = 'S' then '卖出' 
ELSE '' END
HAVING trans_date BETWEEN '2020-01-01' AND '2020-12-31';
转换为:
SELECT trans_date,
CASE WHEN trans_type = 'B' THEN '买入' WHEN trans_type = 'S' then '卖出' 
ELSE '' END, SUM(volume) 
FROM stock_trans_detail
WHERE trans_date BETWEEN '2020-01-01' AND '2020-12-31'
GROUP BY trans_date,trans_type;

铁律13: 使用ORDER BY配合LIMIT分页查询

如:
当LIMIT的偏移量特别大时,效率会非常低
SELECT * FROM score LIMIT 1000,10 效率高
SELECT * FROM score LIMIT 100000,10 效率低
转换为:
SELECT * FROM score ORDER BY student_id LIMIT 100000,10;

铁律14: 避免不合理的DISTINCT

由于DISTINCT去重功能的限制,实际开发过程中使用到DISTINCT的情况很少。如果发现结果集有重复而需要使用DISTINCT去重,
则很可能是因为对业务逻辑理解不足导致的SQL语句的编写问题。

如:
SELECT DISTINCT a.stock_code,a.stock_name
FROM stock a
INNER JOIN stock_trans_detail b
ON a.stock_code = b.stock_code
AND b.trans_date BETWEEN '2020-01-01' AND '2020-12-31‘;
转换为:
SELECT a.stock_code,a.stock_name FROM stock a
WHERE EXISTS (
SELECT 1 FROM stock_trans_detail b
WHERE a.stock_code = b.stock_code
AND b.trans_date BETWEEN '2020-01-01' AND '2020-12-31');

铁律15: 不要把SQL语句写的太冗长

合理使用临时表,而不是想着一个SQL解决所有问题。如果一个SQL关联的表超过5张,就应该考虑拆分。
点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
添砖java的啾 添砖java的啾
3年前
distinct效率更高还是group by效率更高?
目录00结论01distinct的使用02groupby的使用03distinct和groupby原理04推荐groupby的原因00结论先说大致的结论(完整结论在文末):在语义相同,有索引的情况下groupby和distinct都能使用索引,效率相同。在语义相同,无索引的情况下:distinct效率高于groupby。原因是di
待兔 待兔
4个月前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Jacquelyn38 Jacquelyn38
3年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Wesley13 Wesley13
3年前
MySQL千万级别优化·中
MySQL千万级别的查询优化手段·中单列索引(假设在v\_record表中存在id列的索引)1、WHERE条件使用​EXPLAINSELECT\FROMv\_recordWHEREid2​结论:利用索引进行回表查询2、SELECT字段使用
Wesley13 Wesley13
3年前
MySQL索引的索引长度问题
MySQL的每个单表中所创建的索引长度是有限制的,且对不同存储引擎下的表有不同的限制。在MyISAM表中,创建组合索引时,创建的索引长度不能超过1000,注意这里索引的长度的计算是根据表字段设定的长度来标量的,例如:createtabletest(idint,name1varchar(300),name2varchar(300),nam
Wesley13 Wesley13
3年前
mysql5.6 分页查询优化
mysql5.6分页查询优化场景:表结构:主键(非自增)contentCode(varchar),过滤条件列为updateTime(timeStamp),已经为timestamp建立索引。搜索sql为:SELECTFROMmy_hello_tableWHEREupdat
Stella981 Stella981
3年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Stella981 Stella981
3年前
ELK学习笔记之ElasticSearch的索引详解
0x00ElasticSearch的索引和MySQL的索引方式对比Elasticsearch是通过Lucene的倒排索引技术实现比关系型数据库更快的过滤。特别是它对多条件的过滤支持非常好,比如年龄在18和30之间,性别为女性这样的组合查询。倒排索引很多地方都有介绍,但是其比关系型
Wesley13 Wesley13
3年前
mysql组合索引与字段顺序
很多时候,我们在mysql中创建了索引,但是某些查询还是很慢,根本就没有使用到索引!一般来说,可能是某些字段没有创建索引,或者是组合索引中字段的顺序与查询语句中字段的顺序不符。看下面的例子:假设有一张订单表(orders),包含order\_id和product\_id二个字段。一共有31条数据。符合下面语句的数据有5条。执行下面的s