当前位置: 首页 > 图文教程 > 数据库 > MSSQL > 关于对sql2000查询结果进行相关度排序的测试

MSSQL
SQL Server 2005对DBA的要求是否会更高
SQL Server新库和旧库数据字典的比较
一个获取SQL Server数据字典的经典SQL语句
三个SQL视图查出所有SQL Server数据库字典
解决SQL Server连接中最为常见的错误
Browser/Server结构浏览器和服务器结构介绍
Position方式构建Browser/Server结构
VS2003创建和打开ASP.net 工程的若干问题
ASP技巧教程:认识学习codepage的属性
SQL Server日志清除的两个方法
SQL Server端口更改后的数据库连接方式
SQL Server数据库的转储设备
用OMS来实现Oracle数据备份的方法
分析SQL Server的数据转换服务
SQL Server数据库快照形成报表
EFS加密技巧让数据更安全
SQL Server 如何将直接传递查询作为表使用
解析SQL Server 2008的商业智能
SQL Server数据库30步检查安全列表
转换 SQL数据库时的疑难问题

MSSQL 中的 关于对sql2000查询结果进行相关度排序的测试


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-10-30   浏览: 102 ::
收藏到网摘: n/a

 

    sql2000的查询结果进行相关度排序,听起来好象很吸引人,不过真的是可以实现的。
    上午上网看到了一篇利用微软index server来做全文查询的文章(这个以前也看到过,在计算机管理中也自带了这样一个查询功能)
我的IIS默认web服务器在g:/wwwroot下其中有10万多的html文档
   测试:strSearch = "SELECT DocTitle, Path, FileName, Characterization, Size,write,RANK" & _
" FROM SCOPE()" & _
" WHERE CONTAINS ('" & Request.Form("txtSearchFor") & "') ORDER BY RANK  desc" 还进行了相关度的排序,我没有做时间的具体开销
的计算,不过给人的感觉还可以接受,在翻页的时候就非常快了。不过最大的缺点好象就是只能索引静态页面了。
   下午我把以前的一个50多万条记录(主要是歌曲名和歌手名)的数据库在sql2000做了索引,晚上就可以开始测试了。
   测试一: "select top 26 * from song1 where contains(songtitle,'爱')",对结果没有进行任何的处理,只是按照ID的升续排列
时间开销基本上维持在0.016s,速度是很让人满意的,至少感觉不到慢。

   测试二:利用rank值进行了相关度的排序,"order by rank desc" or "order by rank asc",查询结果在排序的质量上让人满意,都比较
准确的,不管是查询时使用 or 或者and进行多关键字的排序都还可以的,不过时间的开销让我受不了,居然在6s到8s之间,
而且cpu也占用比较高
   我看到网上其他的搜索的相关度排序都比较快的,开源的Lucene我没有研究过,因为我不懂java。
不过我想如果在索引的时候对每个关键字进行相关度的运算查询起来应该不会慢的啊,这个我也感到郁闷。