当前位置: 首页 > 图文教程 > 数据库 > MSSQL > 关于对sql2000查询结果进行相关度排序的测试

MSSQL
在SQL Server所在的计算机上运行病毒扫描软件
使用SQL Server导入和索引 Microsoft Word 文档
TOPN 子句与SET ROWCOUNTN 之对比
使用Transact-SQL计算SQL Server处理器的数量
SQL Server中全角和半角字符的比较问题
SQL Server数据库性能的优化
Win9x平台上SQL Server 2000的性能和局限
如何识别真实和自动创建的索引?
修复SQLSERVER2000数据库之实战经验
将一个更新划分为几个批次
一种基于记录集查找特定行的方法
将XML文件导入SQL Server 2000
将列更新从一个表传递到另一个表
打开UDP端口1434以浏览命名实例
如何使用系统管理员帐户管理多个开发人员?
设计数据库之经验谈
数据库的查询优化技术
小写转大写金额
SQL技巧:创建用来按小时报告的查询
SQL语句的自动优化

MSSQL 中的 关于对sql2000查询结果进行相关度排序的测试


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-10-30   浏览: 78 ::
收藏到网摘: n/a

 

    sql2000的查询结果进行相关度排序,听起来好象很吸引人,不过真的是可以实现的。
    上午上网看到了一篇利用微软index server来做全文查询的文章(这个以前也看到过,在计算机管理中也自带了这样一个查询功能)
我的IIS默认web服务器在g:/wwwroot下其中有10万多的html文档
   测试:strSearch = "SELECT DocTitle, Path, FileName, Characterization, Size,write,RANK" & _
" FROM SCOPE()" & _
" WHERE CONTAINS ('" & Request.Form("txtSearchFor") & "') ORDER BY RANK  desc" 还进行了相关度的排序,我没有做时间的具体开销
的计算,不过给人的感觉还可以接受,在翻页的时候就非常快了。不过最大的缺点好象就是只能索引静态页面了。
   下午我把以前的一个50多万条记录(主要是歌曲名和歌手名)的数据库在sql2000做了索引,晚上就可以开始测试了。
   测试一: "select top 26 * from song1 where contains(songtitle,'爱')",对结果没有进行任何的处理,只是按照ID的升续排列
时间开销基本上维持在0.016s,速度是很让人满意的,至少感觉不到慢。

   测试二:利用rank值进行了相关度的排序,"order by rank desc" or "order by rank asc",查询结果在排序的质量上让人满意,都比较
准确的,不管是查询时使用 or 或者and进行多关键字的排序都还可以的,不过时间的开销让我受不了,居然在6s到8s之间,
而且cpu也占用比较高
   我看到网上其他的搜索的相关度排序都比较快的,开源的Lucene我没有研究过,因为我不懂java。
不过我想如果在索引的时候对每个关键字进行相关度的运算查询起来应该不会慢的啊,这个我也感到郁闷。