当前位置: 首页 > 图文教程 > 网站运营 > 网站优化 > 分词切词研究(实例篇)

网站优化
一个seoer给网站设计者的几点建议
针对Z-Blog博客程序 常用博客SEO优化技巧
垃圾网站在一年时间内 pr值从0到6的秘密
网站优化 关键词及主题的优化你做好了吗
浅谈SEO优化连接的几种类型
SEO内链常见形式 做好站内链接四点建议
QQ类网站经验 SEO稳扎稳打才能步步为营
流传很久的一份资料 SEO中HTML标签权重
搜索引擎最不喜欢哪些网站 预防九种情况
对一家FLASH网站进行SEO优化的心得经验
研究是SEO优化最快的成长之路 实践中成长
SEO速成之路 研究
用博客建设外部链接要点
被百度K掉,应提前预防
多种营销方式为SEO所用 思考与技术之别
谷歌中文网站管理员解答释疑重复内容问题
搜索引擎不喜欢的九大因素
多次被搜索引擎惩罚 逐渐发现一些优化忌讳
搜索引擎优化重点之网站内外链接策略
不懂seo也可以做seo的简单方法总汇

网站优化 中的 分词切词研究(实例篇)


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-10-17   浏览: 41 ::
收藏到网摘: n/a

这篇文章论策讨论的是中文分词技术,对seo具有指导意义。可以通过中文分词的研究获得百度的长尾流量。

1、百度分词是根据内容中,第一次出现关键词相关词为标准来分的。例如”正浩生物科技有限公司“这个词

如果你的正文中第一个出现的是”正浩“这个词,那么你的页面上的关键词就会被拆分成”正浩”和“生物科技有限公司“两个词,标题中一定要包含关键词,但不一定要完全匹配,但内容中出现的关键词是要跟百度分词完全匹配的,在完全匹配中又会根据文件URL路径的深度来进行排序,在关键词都完全匹配的情况下,比如说目录比文件有优先权,根目录下的文件要比二级目录下的文件有优先权,完全匹配的会排在前面,然后再是部分匹配的。

2、在关键词没有完全匹配的情况下,如果有分词,比如说:“SEO资料库”这个关键词,有一个网页里第一次出现的关键词是“SEO”,并且有较高的关键词密度,但是这个网页中却没有”资料库“这个关键词,而另一个网页里第一次出现的关键词是“资料库”,那么这个网页的关键词就会被拆分成 “SEO” “资料库” 两个词,虽然第二个网页里包含有“SEO” “资料库” 但是第一个网页还是会排在第二个网页的前面,这说明关键词的前面部分是最重要的。

3、关键词第一部分出现的频率是排名的关键,比如说 ”SEO 资料库“,如果两个网页都没有完全匹配,都是含有两个分词,那么“SEO”这个分词密度高的网页将会排在前面。

4、如果完全匹配,但是关键词第一出现是在页面内容的最后面部分,那么这个网页的排名将比前面这些页面还要低。所以关键词尽早在内容中出现是非常重要的。

5、百度根据第一次出现的相关关键词切词,如果第一次出现的相关关键词是关键词的尾部,那么就从后面开始切,如果是前面部分就从前面开始切,也就是根据网页内容的顺序和反序进行分词,顺序的时候就是以关键词前半部分为起点,反序的时候就是以关键词的后半部分为起点。例如:”正浩生物科技有限公司“ 这个关键词,如果你的网页中第一次出现的关键词是”正浩生物“,那么你这个页面的关键词会被拆分成”正浩生物”和“科技有限公司”两个词。

6、可以根据百度的切词原理,自己来选择比较好作的关键词头部(也就是调整你网页内容中第一次出现的关键词)。也就是进行人为切词,百度会进行从前往后判断,也会从后往前面切。

7、如果在关键词没有完全匹配的情况下,并且关键词出现得不完整,比如说:正浩生物科技有限公司,网页的内容包含的关键词中如果没有“正浩”这个词,那么切词就会从“生物”开始,但是这样的网页都会排在比较靠后了,因为你关键词的前部分都没有包含。

8、缺词的情况下下,如果与不缺词的网页进行比较的话,那还是根据切词前部分的密度进行排序,也就是说按照切词的顺序,如果切出来的词,前部分的密度比后部分的密度比例是关键,例如一个网页中,前部分与后部分关键词的比例是1:2,另外一个网页的比例是1:4,那么当然前面的那个网页排名要靠前。同样在缺词的情况下,切出来前词短的排名有优势。

希望以上这些能帮助大家了解百度的关键字排名规则。

本文由 www.lunce.net 站长论策首发 转载请留链接,谢谢!