当前位置: 首页 > 图文教程 > 网站运营 > 建站经验 > 什么是垂直搜索?

建站经验
逐个分析大型网站的实例 掌握构建大型网站的架构
阿里巴巴成鸡肋:购物上淘宝、批发上1688
使用在线wap模拟器或软件在个人电脑上访问wap网站
经验分享:网络广告假流量问题的鉴别方法
如何选择和设计适合自己的评论网站类型
国内的网站页面设计风格应该热热闹闹
网络排查清理风 企业网站不备案被关闭
Mozilla一款产品UI设计全盘照抄Web设计公司的网站设计
淘宝网推出消费者门户
经验分享:企业网站建设的几点注意事项
美国B2C平台的成功创意和中国电商市场的比较
日本雅虎的时尚频道的电子杂志购物的魅力
网站备案实际经历:历时2个月两次被拒绝
个人网站实名制:站长们是否已经准备好
ICANN:域名注册信息不实将赞归注册商所有
减少未压缩的数据 让网络速度更快
CM域名不能解析不能修改DNS 疑顶级注册局倒闭
企业建站的基础性常识和资源
Yahoo上$1.99注册.com域名的图文教程
核验备案资料是否真实有效 部分网站备案号被注销

建站经验 中的 什么是垂直搜索?


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-10-17   浏览: 27 ::
收藏到网摘: n/a

垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。

垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化信息抽取,也就是将网页的非结构化数据抽取成特定的结构化信息数据,好比网页搜索是以网页为最小单位,基于视觉的网页块分析是以网页块为最小单位,而垂直搜索是以结构化数据为最小单位。然后将这些数据存储到数据库,进行进一步的加工处理,如:去重、分类等,最后分词、索引再以搜索的方式满足用户的需求。

整个过程中,数据由非结构化数据抽取成结构化数据,经过深度加工处理后以非结构化的方式和结构化的方式返回给用户。

垂直搜索引擎的应用方向很多,比如企业库搜索、供求信息搜索引擎、购物搜索、房产搜索、人才搜索、地图搜索、mp3搜索、图片搜索……几乎各行各业各类信息都可以进一步细化成各类的垂直搜索引擎。

举个例子来说明会更容易理解,比如购物搜索引擎,整体流程大致如下:抓取网页后,对网页商品信息进行抽取,抽取出商品名称、价格、简介……甚至可以进一步将笔记本简介细分成“品牌、型号、CPU、内存、硬盘、显示屏、……”然后对信息进行清洗、去重、分类、分析比较、数据挖掘,最后通过分词索引提供用户搜索、通过分析挖掘提供市场行情报告。

垂直搜索引擎大体上需要以下技术

1、Spider

2、网页结构化信息抽取技术或元数据采集技术

3、分词、索引

4、其他信息处理技术

垂直搜索引擎的技术评估应从以下几点来判断

1、全面性

2、更新性

3、准确性

4、功能性

垂直搜索的进入门槛很低,但是竞争的门槛很高。没有专注的精神和精湛的技术是不行的。行业门户网站具备行业优势但他们又是没有技术优势的,绝对不要想像着招几个人就可以搞定垂直搜索的全部技术,作为一个需要持续改进可运营的产品而不是一个项目来说对技术的把握控制程度又是垂直搜索成功的重要因素之一。