当前位置: 首页 > 图文教程 > 数据库 > MYSQL > 由浅入深讲解MySQL数据库索引的选择性

MYSQL
轻松掌握如何从命令行启动mysqld服务器
教你快速掌握怎样在Windows下升级MySQL
解析:安装 MySQL时如何选择安装软件包
解析:快速的掌握 MySQL支持的操作系统
MySQL环境下导入数据时是否需要禁用索引
配置高可用性的MySQL服务器负载均衡群集
使用ERWin进行基于MySQL数据库的物理设计
数据库应用经验:如何简单安装MySQL数据库
DBA应当了解的MySQL客户端程序启动选项
将MySQL 5.0下的数据导入到MySQL 3.23中
讲解MaxDB数据库和MySQL数据库的主要差别
实例讲解如何利用crontab定时备份MySQL
个人经验总结:完全卸载MySQL数据库5.0
如何在Unix系统环境下安装MySQL数据库
适宜做简单搜索的MySQL数据库全文索引
教你在MySQL 5.0以上版本中配置主从库
经验总结:修改MySQL默认密码的具体步骤
将后台数据从Berkeley的文件DB转到MySQL
详细介绍查询优化技术在现实系统中的运用
MySQL数据库中对前端和后台进行系统优化

MYSQL 中的 由浅入深讲解MySQL数据库索引的选择性


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-10-17   浏览: 74 ::
收藏到网摘: n/a

在MySQL中,对于索引的使用并是一直都采用正确的决定。

简单表的示例:

CREATE TABLE `r2` (

ID` int(11) DEFAULT NULL,

ID1` int(11) DEFAULT NULL,

CNAME` varchar(32) DEFAULT NULL,

KEY `ID1` (`ID1`)

) ENGINE=MyISAM DEFAULT CHARSET=latin1

SELECT COUNT(*) FROM r2;

250001 (V1)

SELECT COUNT(*) FROM r2 WHERE ID1=1;

83036 (V2)

(execution time = 110 ms)

(ID1=1)条件查询索引的选择性是 V2/V1 = 0.3321 或 33.21%

一般来说(例如书 “SQL Tuning“),如果选择性超过 20% 那么全表扫描比使用索引性能更优。

我知道Oracle一直是在选择性超过25%时会选择全表扫描。

而MySQL呢:

mysql> EXPLAIN SELECT COUNT(SUBNAME) FROM r2 WHERE ID1=1;

+----+-------------+-------+------+---------------+-----

| id | select_type | TABLE | type | possible_keys | KEY | key_len | ref | rows | Extra |

+----+-------------+-------+------+---------------+-----

| 1 | SIMPLE | t2 | ref | ID1 | ID1 | 5 | const | 81371 | USING WHERE |

+----+-------------+-------+------+---------------+-----

这就是MySQL将会使用索引来完成这个查询。

让我们来对比索引查询和全表扫描的执行时间:

SELECT COUNT(SUBNAME) FROM t2 WHERE ID1=1 - 410 ms

SELECT COUNT(SUBNAME) FROM t2 IGNORE INDEX (ID1) WHERE ID1=1 - 200 ms

如你所看到全表扫描要快2倍。

参考更特殊的例子:选择性 ~95%:

SELECT cnt2 / cnt1 FROM (SELECT count(*) cnt1 FROM r2) d1, (SELECT count(*) cnt2 FROM r2 WHERE ID1=1) d2;

0.9492 = 94.92%;

说明MySQL将会用索引来完成查询。

执行时间:

SELECT COUNT(SUBNAME) FROM t2 WHERE ID1=1 - 1200 ms

SELECT COUNT(SUBNAME) FROM t2 IGNORE INDEX (ID1) WHERE ID1=1 - 260 ms

这次全表扫描要快4.6倍。

为什么MySQL选择索引访问查询?

MySQL没有计算索引的选择性,只是预测逻辑IO操作的数量,并且我们的例子中间的逻辑IO数量,索引访问要少于全表扫描。

最后我们得出结论,对于索引要小心使用,因为它们并不能帮助所有的查询。