数据库复合索引

2017-01-13 10:45:46来源:oschina作者:OsChina617人点击

参照:http://blog.sina.com.cn/s/blog_5a8b8eb80100sg83.html博客


1.什么是复合索引
1.1复合索引定义

索引可以包含一个、两个或更多个列。两个或更多个列上的索引被称作复合索引。


利用索引中的附加列,您可以缩小搜索的范围,但使用一个具有两列的索引不同于使用两个单独的索引。复合索引的结构与电话簿类似,人名由姓和名构成,电话簿首先按姓氏对进行排序,然后按名字对有相同姓氏的人进行排序。如果您知道姓,电话簿将非常有用;如果您知道姓和名,电话簿则更为有用,但如果您只知道名不姓,电话簿将没有用处。


所以说创建复合索引时,应该仔细考虑列的顺序。对索引中的所有列执行搜索或仅对前几列执行搜索时,复合索引非常有用;仅对后面的任意列执行搜索时,复合索引则没有用处。


如:建立姓名、年龄、性别的复合索引。


起作用的复合索引查询:


1.2复合索引的建立原则:

如果您很可能仅对一个列多次执行搜索,则该列应该是复合索引中的第一列。如果您很可能对一个两列索引中的两个列执行单独的搜索,则应该创建另一个仅包含第二列的索引。


如上图所示,如果查询中需要对年龄和性别做查询,则应当再新建一个包含年龄和性别的复合索引。


包含多个列的主键始终会自动以复合索引的形式创建索引,其列的顺序是它们在表定义中出现的顺序,而不是在主键定义中指定的顺序。在考虑将来通过主键执行的搜索,确定哪一列应该排在最前面。


请注意,创建复合索引应当包含少数几个列,并且这些列经常在select查询里使用。在复合索引里包含太多的列不仅不会给带来太多好处。而且由于使用相当多的内存来存储复合索引的列的值,其后果是内存溢出和性能降低。


1.3复合索引对排序的优化:

复合索引只对和索引中排序相同或相反的order by语句优化。


在创建复合索引时,每一列都定义了升序或者是降序。如定义一个复合索引:


CREATE INDEX idx_example ON table1 (col1 ASC, col2 DESC, col3 ASC)


其中有三列分别是:col1升序,col2降序,col3升序。现在如果我们执行两个查询


1:Select col1, col2, col3 from table1 order by col1ASC, col2DESC, col3ASC和索引顺序相同


2:Select col1, col2, col3 from table1 order by col1DESC,col2ASC, col3DESC和索引顺序相反


查询1,2都可以别复合索引优化。


如果查询为:


Select col1, col2, col3 from table1 order by col1ASC, col2ASC, col3ASC排序结果和索引完全不同时,此时的查询不会被复合索引优化。


查询优化器在在where查询中的作用:


1.如果一个多列索引存在于列Col1和Col2上, 则以下语句:Select*fromtablewherecol1=val1 AND col2=val2 查询优化器会试图通过决定哪个索引将找到更少的行。之后用得到的索引去取值。


1.如果存在一个多列索引,任何最左面的索引前缀能被优化器使用。所以联合索引的顺序不同,影响索引的选择,尽量将值少的放在前面。 如:一个多列索引为(col1,col2,col3) 那么在索引在列(col1)、(col1 col2)、(col1 col2 col3)的搜索会有作用。 SELECT * FROM tb WHERE col1=val1


SELECT * FROM tb WHERE col1=val1andcol2=val2


SELECT * FROM tb WHERE col1=val1andcol2=val2 AND col3 =val3


2.如果列不构成索引的最左面前缀,则建立的索引将不起作用。 如: SELECT * FROM tbWHERE col3=val3


SELECT * FROM tb WHERE col2=val2


SELECT * FROM tb WHERE col2=val2 and col3=val3


3.如果一个Like语句的查询条件不以通配符起始则使用索引。 如:%车或%车%不使用索引。 车%使用索引。


索引的缺点:


1.占用磁盘空间。


2.增加了插入和删除的操作时间。一个表拥有的索引越多,插入和删除的速度越慢。如要求快速录入的系统不宜建过多索引。

2.下面是一些常见的索引限制问题

1、使用不等于操作符(<>, !=)


下面这种情况,即使在列dept_id有一个索引,查询语句仍然执行一次全表扫描


select * from dept where staff_num <> 1000;


但是开发中的确需要这样的查询,难道没有解决问题的办法了吗?


有!


通过把用or语法替代不等号进行查询,就可以使用索引,以避免全表扫描:上面的语句改成下面这样的,就可以使用索引了。


select * from dept shere staff_num < 1000 or dept_id > 1000;

2、使用is null或is not null


使用is null或is nuo null也会限制索引的使用,因为数据库并没有定义null值。如果被索引的列中有很多null,就不会使用这个索引(除非索引是一个位图索引,关于位图索引,会在以后的blog文章里做详细解释)。在sql语句中使用null会造成很多麻烦。


解决这个问题的办法就是:建表时把需要索引的列定义为非空(not null)

3、使用函数


如果没有使用基于函数的索引,那么where子句中对存在索引的列使用函数时,会使优化器忽略掉这些索引。下面的查询就不会使用索引:


select * from staff where trunc(birthdate) = '01-MAY-82';


但是把函数应用在条件上,索引是可以生效的,把上面的语句改成下面的语句,就可以通过索引进行查找。


select * from staff where birthdate < (to_date('01-MAY-82') + 0.9999);

4、比较不匹配的数据类型


比较不匹配的数据类型也是难于发现的性能问题之一。


下面的例子中,dept_id是一个varchar2型的字段,在这个字段上有索引,但是下面的语句会执行全表扫描。


select * from dept where dept_id = 900198;


这是因为oracle会自动把where子句转换成to_number(dept_id)=900198,就是3所说的情况,这样就限制了索引的使用。


把SQL语句改为如下形式就可以使用索引


select * from dept where dept_id = '900198';


最新文章

123

最新摄影

微信扫一扫

第七城市微信公众平台