当前位置: 首页 > 图文教程 > 网站运营 > 网站优化 > 分词切词研究(实例篇)

网站优化
对刚刚接触搜索引擎优化站长们的衷心建议
谷歌官方优化建议:动态网址与静态网址
谷歌官方《搜索引擎优化指南》网络蜘蛛篇
影响网站权重的七个因素
分述百度和谷歌对搜索引擎作弊的不同判定
新建网站进行搜索引擎优化的六个基本步骤
禁忌:网站优化中绝对不能够做的九件事情
57条让你老妈看完都能成为SEO高手的技巧
中文网站管理员讲解 关于网页链接的知识
放弃SEO是理性的胜利 SEO细节决定成败
百度与谷歌如何判断网站文章是否原创试析
谷歌《搜索引擎优化指南》为链接添加nofollow属性
从两个案例分析 搜索优化中IP地址很重要
释疑链接的四个误区 谈外连对网站的影响
站长需要知道的55条搜索引擎优化绝佳技巧
内容更新频率与搜索引擎关系 让它熟悉你
新站的原创之路
纵搜索引擎算法改变 核心思路永远不会变
谷歌官方《搜索引擎优化指南》网站推广篇
谷歌官方《搜索引擎优化指南》网站管理篇

网站优化 中的 分词切词研究(实例篇)


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-10-17   浏览: 64 ::
收藏到网摘: n/a

这篇文章论策讨论的是中文分词技术,对seo具有指导意义。可以通过中文分词的研究获得百度的长尾流量。

1、百度分词是根据内容中,第一次出现关键词相关词为标准来分的。例如”正浩生物科技有限公司“这个词

如果你的正文中第一个出现的是”正浩“这个词,那么你的页面上的关键词就会被拆分成”正浩”和“生物科技有限公司“两个词,标题中一定要包含关键词,但不一定要完全匹配,但内容中出现的关键词是要跟百度分词完全匹配的,在完全匹配中又会根据文件URL路径的深度来进行排序,在关键词都完全匹配的情况下,比如说目录比文件有优先权,根目录下的文件要比二级目录下的文件有优先权,完全匹配的会排在前面,然后再是部分匹配的。

2、在关键词没有完全匹配的情况下,如果有分词,比如说:“SEO资料库”这个关键词,有一个网页里第一次出现的关键词是“SEO”,并且有较高的关键词密度,但是这个网页中却没有”资料库“这个关键词,而另一个网页里第一次出现的关键词是“资料库”,那么这个网页的关键词就会被拆分成 “SEO” “资料库” 两个词,虽然第二个网页里包含有“SEO” “资料库” 但是第一个网页还是会排在第二个网页的前面,这说明关键词的前面部分是最重要的。

3、关键词第一部分出现的频率是排名的关键,比如说 ”SEO 资料库“,如果两个网页都没有完全匹配,都是含有两个分词,那么“SEO”这个分词密度高的网页将会排在前面。

4、如果完全匹配,但是关键词第一出现是在页面内容的最后面部分,那么这个网页的排名将比前面这些页面还要低。所以关键词尽早在内容中出现是非常重要的。

5、百度根据第一次出现的相关关键词切词,如果第一次出现的相关关键词是关键词的尾部,那么就从后面开始切,如果是前面部分就从前面开始切,也就是根据网页内容的顺序和反序进行分词,顺序的时候就是以关键词前半部分为起点,反序的时候就是以关键词的后半部分为起点。例如:”正浩生物科技有限公司“ 这个关键词,如果你的网页中第一次出现的关键词是”正浩生物“,那么你这个页面的关键词会被拆分成”正浩生物”和“科技有限公司”两个词。

6、可以根据百度的切词原理,自己来选择比较好作的关键词头部(也就是调整你网页内容中第一次出现的关键词)。也就是进行人为切词,百度会进行从前往后判断,也会从后往前面切。

7、如果在关键词没有完全匹配的情况下,并且关键词出现得不完整,比如说:正浩生物科技有限公司,网页的内容包含的关键词中如果没有“正浩”这个词,那么切词就会从“生物”开始,但是这样的网页都会排在比较靠后了,因为你关键词的前部分都没有包含。

8、缺词的情况下下,如果与不缺词的网页进行比较的话,那还是根据切词前部分的密度进行排序,也就是说按照切词的顺序,如果切出来的词,前部分的密度比后部分的密度比例是关键,例如一个网页中,前部分与后部分关键词的比例是1:2,另外一个网页的比例是1:4,那么当然前面的那个网页排名要靠前。同样在缺词的情况下,切出来前词短的排名有优势。

希望以上这些能帮助大家了解百度的关键字排名规则。

本文由 www.lunce.net 站长论策首发 转载请留链接,谢谢!