MySQL-SQL优化

MySQL SQL优化

优化实战

尽量全值匹配

CREATE TABLE `staffs` (
  id INT PRIMARY KEY AUTO_INCREMENT,
  NAME VARCHAR (24) NOT NULL DEFAULT "" COMMENT '姓名',
  age INT NOT NULL DEFAULT 0 COMMENT '年龄',
  pos VARCHAR (20) NOT NULL DEFAULT "" COMMENT '职位',
  add_time TIMESTAMP NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '入职时间'
) CHARSET utf8 COMMENT '员工记录表' ;

INSERT INTO staffs(NAME,age,pos,add_time) VALUES('z3',22,'manage',NOW());
INSERT INTO staffs(NAME,age,pos,add_time) VALUES('july',23,'dev',NOW());
INSERT INTO staffs(NAME,age,pos,add_time) VALUES('2000',23,'dev',NOW());

添加索引

当建立了索引列后，能在wherel条件中使用索引的尽量所用。

ALTER TABLE staffs ADD INDEX idx_staffs_nameAgePos(NAME,age,pos);

EXPLAIN SELECT * FROM staffs WHERE NAME = 'July';
EXPLAIN SELECT * FROM staffs WHERE NAME = 'July' AND age = 25;
EXPLAIN SELECT * FROM staffs WHERE NAME = 'July' AND age = 25 AND pos = 'dev';

最佳左前缀法则

如果索引了多列，要遵守最左前缀法则。指的是查询从索引的最左前列开始并且不跳过索引中的列。

1
2
3

EXPLAIN SELECT * FROM staffs WHERE age = 25 AND pos = 'dev';
EXPLAIN SELECT * FROM staffs WHERE pos = 'dev';
EXPLAIN SELECT * FROM staffs WHERE NAME = 'July';

不在索引列上做任何操作

不在索引列上做任何操作（计算、函数、(自动or手动)类型转换），会导致索引失效而转向全表扫描

1 2	EXPLAIN SELECT * FROM staffs WHERE NAME = 'July'; EXPLAIN SELECT * FROM staffs WHERE left(NAME,4) = 'July'

范围条件放最后

中间有范围查询会导致后面的索引列全部失效

EXPLAIN SELECT * FROM staffs WHERE NAME = 'July';
EXPLAIN SELECT * FROM staffs WHERE NAME = 'July' and age =22;
EXPLAIN SELECT * FROM staffs WHERE NAME = 'July' and age =22 and pos='manager';
-- 中间有范围查询会导致后面的索引列全部失效：
EXPLAIN SELECT * FROM staffs WHERE NAME = 'July' and age >22 and pos='manager';

覆盖索引尽量用

尽量使用覆盖索引(只访问索引的查询(索引列和查询列一致))，减少select * 使用

EXPLAIN SELECT * FROM staffs WHERE NAME = 'July'  and age =22 and pos='manager';
EXPLAIN SELECT name,age,pos FROM staffs WHERE NAME = 'July'  and age =22 and pos='manager';
EXPLAIN SELECT * FROM staffs WHERE NAME = 'July'  and age >22 and pos='manager';
EXPLAIN SELECT name,age,pos FROM staffs WHERE NAME = 'July'  and age >22 and pos='manager';

不等于要甚用

mysql 在使用不等于(!= 或者<>)的时候无法使用索引会导致全表扫描

1
2
3

EXPLAIN SELECT * FROM staffs WHERE NAME = 'July';
EXPLAIN SELECT * FROM staffs WHERE NAME != 'July';
EXPLAIN SELECT * FROM staffs WHERE NAME <> 'July';

如果定要需要使用不等于,请用覆盖索引

1 2	EXPLAIN SELECT name,age,pos FROM staffs WHERE NAME != 'July'; EXPLAIN SELECT name,age,pos FROM staffs WHERE NAME <> 'July';

Null/Not 有影响

注意null/not null对索引的可能影响

自定定义为NOT NULL

在字段为not null的情况下，使用is null 或 is not null 会导致索引失效

ALTER TABLE `staffs`   
  ADD  INDEX `idx_staffs_name` (`name`);
  
EXPLAIN select * from staffs where name is not null;

解决办法

使用覆盖索引

1	EXPLAIN select name,age,pos from staffs where name is not null;

自定义为NULL或者不定义

Is not null 的情况会导致索引失效

1 2	EXPLAIN select * from staffs where name is null; -- 带索引查询 EXPLAIN select * from staffs where name is not null; -- 无索引

解决办法

使用覆盖索引

1	EXPLAIN select * from staffs where name is not null;

Like查询要当心

like以通配符开头(‘%abc…’)mysql索引失效会变成全表扫描的操作

EXPLAIN select * from staffs where name ='july';

EXPLAIN select * from staffs where name like '%july%';

EXPLAIN select * from staffs where name like '%july';

EXPLAIN select * from staffs where name like 'july%';

解决办法

使用覆盖索引

1	EXPLAIN select name,age,pos from staffs where name like '%july%';

字符类型加引号

字符串不加单引号索引失效

1	EXPLAIN select * from staffs where name = 917;

解决办法

~~使用覆盖索引~~

~~EXPLAIN select name,age,pos from staffs where name = 917~~

解决方式

请加引号

1	EXPLAIN select * from staffs where name = '917';

OR改UNION效率更高

EXPLAIN select * from staffs where name='July' or name = 'z3';

-- 解决方式：覆盖索引

EXPLAIN select name,age from staffs where name='July' or name = 'z3';

改用UNION

1	EXPLAIN select * from staffs where name='July' UNION select * from staffs where name = 'z3';

记忆总结

全职匹配我最爱，最左前缀要遵守；

带头大哥不能死，中间兄弟不能断；

索引列上少计算，范围之后全失效；

LIKE百分写最右，覆盖索引不写*；

不等空值还有OR，索引影响要注意；

VAR引号不可丢， SQL优化有诀窍。

join详解

SQL优化方案

常用30种SQL查询语句优化方法

应尽量避免在 where 子句中使用!=或<>操作符，否则引擎将放弃使用索引而进行全表扫描。
对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。
应尽量避免在 where 子句中对字段进行 null 值判断，否则将导致引擎放弃使用索引而进行全表扫描。如：
1
select id from t where num is null
可以在num上设置默认值0，确保表中num列没有null值，然后这样查询：
1
select id from t where num=0
尽量避免在 where 子句中使用 or 来连接条件，否则将导致引擎放弃使用索引而进行全表扫描，如：
1
select id from t where num=10 or num=20
可以这样查询：
1
2
3
select id from t where num=10
union all
select id from t where num=20
下面的查询也将导致全表扫描：(不能前置百分号)
1
select id from t where name like ‘%c%’
下面走索引
1
select id from t where name like ‘c%’
若要提高效率，可以考虑全文检索。
in 和 not in 也要慎用，否则会导致全表扫描，如：
1
select id from t where num in(1,2,3)
对于连续的数值，能用 between 就不要用 in 了：
1
select id from t where num between 1 and 3
如果在 where 子句中使用参数，也会导致全表扫描。因为SQL只有在运行时才会解析局部变量，但优化程序不能将访问计划的选择推迟到运行时；它必须在编译时进行选择。然而，如果在编译时建立访问计划，变量的值还是未知的，因而无法作为索引选择的输入项。如下面语句将进行全表扫描：
1
select id from t where num=@num
可以改为强制查询使用索引：
1
select id from t with(index(索引名)) where num=@num
应尽量避免在 where 子句中对字段进行表达式操作，这将导致引擎放弃使用索引而进行全表扫描。如：
1
select id from t where num/2=100
应改为:
1
select id from t where num=100*2

应尽量避免在where子句中对字段进行函数操作，这将导致引擎放弃使用索引而进行全表扫描。如：

1 2	select id from t where substring(name,1,3)=’abc’ –name以abc开头的id select id from t where datediff(day,createdate,’2005-11-30′)=0 –’2005-11-30′生成的id

应改为:

1 2	select id from t where name like ‘abc%’ select id from t where createdate>=’2005-11-30′ and createdate<’2005-12-1′

不要在 where 子句中的“=”左边进行函数.算术运算或其他表达式运算，否则系统将可能无法正确使用索引。
在使用索引字段作为条件时，如果该索引是复合索引，那么必须使用到该索引中的第一个字段作为条件时才能保证系统使用该索引，否则该索引将不会被使用，并且应尽可能的让字段顺序与索引顺序相一致。
不要写一些没有意义的查询，如需要生成一个空表结构：
1
select col1,col2 into #t from t where 1=0
这类代码不会返回任何结果集，但是会消耗系统资源的，应改成这样：
1
create table #t(…)

很多时候用 exists 代替 in 是一个好的选择：

1	select num from a where num in(select num from b)

用下面的语句替换：

1	select num from a where exists(select 1 from b where num=a.num)

并不是所有索引对查询都有效，SQL是根据表中数据来进行查询优化的，当索引列有大量数据重复时，SQL查询可能不会去利用索引，如一表中有字段 sex，male.female几乎各一半，那么即使在sex上建了索引也对查询效率起不了作用。
索引并不是越多越好，索引固然可以提高相应的 select 的效率，但同时也降低了 insert 及 update 的效率，因为 insert 或 update 时有可能会重建索引，所以怎样建索引需要慎重考虑，视具体情况而定。一个表的索引数较好不要超过6个，若太多则应考虑一些不常使用到的列上建的索引是否有必要。
应尽可能的避免更新 clustered 索引数据列，因为 clustered 索引数据列的顺序就是表记录的物理存储顺序，一旦该列值改变将导致整个表记录的顺序的调整，会耗费相当大的资源。若应用系统需要频繁更新 clustered 索引数据列，那么需要考虑是否应将该索引建为 clustered 索引。
尽量使用数字型字段，若只含数值信息的字段尽量不要设计为字符型，这会降低查询和连接的性能，并会增加存储开销。这是因为引擎在处理查询和连接时会逐个比较字符串中每一个字符，而对于数字型而言只需要比较一次就够了。
尽可能的使用 varchar/nvarchar 代替 char/nchar ，因为首先变长字段存储空间小，可以节省存储空间，其次对于查询来说，在一个相对较小的字段内搜索效率显然要高些。
任何地方都不要使用 select * from t ，用具体的字段列表代替“*”，不要返回用不到的任何字段。
尽量使用表变量来代替临时表。如果表变量包含大量数据，请注意索引非常有限（只有主键索引）。
避免频繁创建和删除临时表，以减少系统表资源的消耗。
临时表并不是不可使用，适当地使用它们可以使某些例程更有效，例如，当需要重复引用大型表或常用表中的某个数据集时。但是，对于一次性事件，较好使用导出表。
在新建临时表时，如果一次性插入数据量很大，那么可以使用 select into 代替 create table，避免造成大量 log ，以提高速度；如果数据量不大，为了缓和系统表的资源，应先create table，然后insert。
如果使用到了临时表，在存储过程的最后务必将所有的临时表显式删除，先 truncate table ，然后 drop table ，这样可以避免系统表的较长时间锁定。
尽量避免使用游标，因为游标的效率较差，如果游标操作的数据超过1万行，那么就应该考虑改写。
使用基于游标的方法或临时表方法之前，应先寻找基于集的解决方案来解决问题，基于集的方法通常更有效。
与临时表一样，游标并不是不可使用。对小型数据集使用 FAST_FORWARD 游标通常要优于其他逐行处理方法，尤其是在必须引用几个表才能获得所需的数据时。在结果集中包括“合计”的例程通常要比使用游标执行的速度快。如果开发时间允许，基于游标的方法和基于集的方法都可以尝试一下，看哪一种方法的效果更好。
在所有的存储过程和触发器的开始处设置 SET NOCOUNT ON ，在结束时设置 SET NOCOUNT OFF 。无需在执行存储过程和触发器的每个语句后向客户端发送 DONEINPROC 消息。
尽量避免向客户端返回大数据量，若数据量过大，应该考虑相应需求是否合理。
尽量避免大事务操作，提高系统并发能力。