当前位置: 首页 > 图文教程 > 数据库 > MYSQL > mysql中从字段中URL提取域名信息

MYSQL
MS SQL大值数据类型varchar(max)、nvarchar(max)、varbinary(max)
MySQL索引经验之浅见
提高MySQL 查询效率的三个技巧(1)
提高MySQL 查询效率的三个技巧(2)
提高MySQL 查询效率的三个技巧(3)
MySQL中的mysqldump命令使用详解
Linux下mysql的C API简单使用
MYSQL 有条件地插入记录
mysql 注释方法
MySQL备份--使用mysqldump全备
Mysql索引
5种方法优化MySQL插入表格查询
java实现插入mysql二进制文件,blob类型,遇到问题及解决办法
mysql中root用户的密码修改和消除
完全优化MySQL数据库性能的八大巧方法
MySQL与标准的兼容性
优化MYSQL服务器
MYSQL 权限
Mysql 基本用法
Mysql 备份与恢复

MYSQL 中的 mysql中从字段中URL提取域名信息


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-10-17   浏览: 69 ::
收藏到网摘: n/a

如果你有一字段dm记录了一个url,为了更好的优化模糊查询速度或统计速度,在数据表原有的结构上增加3个字段,分别为

  `sdm` varchar(64) NOT NULL,   #subdomain记录子域名,如:123456.user.qzone.qq.com
  `tdm` varchar(32) NOT NULL,    #topdomain记录一级域名,如:qq.com
  `rdm` varchar(8) NOT NULL,      #rootdomain记录根域,如:com

操作顺序

# 1、为表增加字段
ALTER TABLE `tablename` ADD `sdm` varchar(64) NOT NULL, ADD `tdm` varchar(32) NOT NULL, ADD `rdm` varchar(8) NOT NULL;

# 2、提取url中的域名信息

UPDATE `tablename` SET `sdm`=SUBSTRING_INDEX(SUBSTRING_INDEX(SUBSTRING_INDEX(`dm`, '/', 3), '/', -1) ,':',1);

# 3、提取域名中的根域
UPDATE `tablename` SET `rdm`=(IF(`sdm` REGEXP '(com|tel|mobi|net|org|asia|me|tv|biz|cc|name|info)(\\.[a-zA-Z]{2})$', SUBSTRING_INDEX(`sdm`, '.', -2), IF(`sdm` REGEXP '([a-zA-Z]{2,4})$', SUBSTRING_INDEX(`sdm`, '.', -1), '')));

# 4、根据子域名和根域取一级域名

UPDATE `tablename` SET `tdm`=CONCAT(SUBSTRING_INDEX(TRIM(TRAILING `rdm` FROM `sdm`), '.', -2), `rdm`) ;

执行结果:
影响的数据栏: 126978
时间: 7.172ms