当前位置: 首页 > 图文教程 > 数据库 > MYSQL > 由浅入深讲解MySQL数据库索引的选择性

MYSQL
mysql 常用数据库语句 小练习
MYSQL ERROR 1045 (28000): Access denied for user (using password: YES)问题的解决
mysql 字符集的系统变量说明
MySQL 在触发器里中断记录的插入或更新?
将MySQL数据库移植为PostgreSQL
mysql 操作总结 INSERT和REPLACE
linux mysql忘记密码的多种解决或Access denied for user ''root''@''localhost''
运用mysqldump 工具时需要注意的问题
mysql 优化日记
MySQL 字符串函数大全
mysql 截取指定的两个字符串之间的内容
MySQL 备份还原数据库批处理
mysql 数据库中my.ini的优化 2G内存针对站多 抗压型的设置
Mysql 数字类型转换函数
mysql 动态生成测试数据
mysql 显示SQL语句执行时间的代码
mysql 设置查询缓存
MYSQL explain 执行计划
MySQL 有输入输出参数的存储过程实例
巧用mysql提示符prompt清晰管理数据库的方法

MYSQL 中的 由浅入深讲解MySQL数据库索引的选择性


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-10-17   浏览: 93 ::
收藏到网摘: n/a

在MySQL中,对于索引的使用并是一直都采用正确的决定。

简单表的示例:

CREATE TABLE `r2` (

ID` int(11) DEFAULT NULL,

ID1` int(11) DEFAULT NULL,

CNAME` varchar(32) DEFAULT NULL,

KEY `ID1` (`ID1`)

) ENGINE=MyISAM DEFAULT CHARSET=latin1

SELECT COUNT(*) FROM r2;

250001 (V1)

SELECT COUNT(*) FROM r2 WHERE ID1=1;

83036 (V2)

(execution time = 110 ms)

(ID1=1)条件查询索引的选择性是 V2/V1 = 0.3321 或 33.21%

一般来说(例如书 “SQL Tuning“),如果选择性超过 20% 那么全表扫描比使用索引性能更优。

我知道Oracle一直是在选择性超过25%时会选择全表扫描。

而MySQL呢:

mysql> EXPLAIN SELECT COUNT(SUBNAME) FROM r2 WHERE ID1=1;

+----+-------------+-------+------+---------------+-----

| id | select_type | TABLE | type | possible_keys | KEY | key_len | ref | rows | Extra |

+----+-------------+-------+------+---------------+-----

| 1 | SIMPLE | t2 | ref | ID1 | ID1 | 5 | const | 81371 | USING WHERE |

+----+-------------+-------+------+---------------+-----

这就是MySQL将会使用索引来完成这个查询。

让我们来对比索引查询和全表扫描的执行时间:

SELECT COUNT(SUBNAME) FROM t2 WHERE ID1=1 - 410 ms

SELECT COUNT(SUBNAME) FROM t2 IGNORE INDEX (ID1) WHERE ID1=1 - 200 ms

如你所看到全表扫描要快2倍。

参考更特殊的例子:选择性 ~95%:

SELECT cnt2 / cnt1 FROM (SELECT count(*) cnt1 FROM r2) d1, (SELECT count(*) cnt2 FROM r2 WHERE ID1=1) d2;

0.9492 = 94.92%;

说明MySQL将会用索引来完成查询。

执行时间:

SELECT COUNT(SUBNAME) FROM t2 WHERE ID1=1 - 1200 ms

SELECT COUNT(SUBNAME) FROM t2 IGNORE INDEX (ID1) WHERE ID1=1 - 260 ms

这次全表扫描要快4.6倍。

为什么MySQL选择索引访问查询?

MySQL没有计算索引的选择性,只是预测逻辑IO操作的数量,并且我们的例子中间的逻辑IO数量,索引访问要少于全表扫描。

最后我们得出结论,对于索引要小心使用,因为它们并不能帮助所有的查询。