当前位置: 首页 > 图文教程 > 网站运营 > 网站优化 > 分词切词研究(实例篇)

网站优化
SEO的步骤参考
SEO 两大搜索引擎网站近期算法分析
SEO 搜索引擎算法探讨
SEO 选择合适的CMS建站
SEO Google如何处理低质量链接
SEO 网站管理员工具深入分析
SEO 分析某关键词的竞争强度
B2C 电子商务网站如何做推广和优化
网页游戏的推广的策略与效果分析
网站排名下降的主要原因分析
网站关键词排名发生变化时的应对方法
Google为网站提供相关链接功能
正确解决IE6的问题的方法
谈google 命名锚链接识别网页段落
动易CMS的目录结构SEO优化
让你的wordpress博客备受搜索引擎青睐
经过实践后觉得确实有效的Baidu优化经验
网站主要关键词排名不高的原因分析
seo优化通用方式小结
网站推广3种方法操作流程详解

网站优化 中的 分词切词研究(实例篇)


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-10-17   浏览: 49 ::
收藏到网摘: n/a

这篇文章论策讨论的是中文分词技术,对seo具有指导意义。可以通过中文分词的研究获得百度的长尾流量。

1、百度分词是根据内容中,第一次出现关键词相关词为标准来分的。例如”正浩生物科技有限公司“这个词

如果你的正文中第一个出现的是”正浩“这个词,那么你的页面上的关键词就会被拆分成”正浩”和“生物科技有限公司“两个词,标题中一定要包含关键词,但不一定要完全匹配,但内容中出现的关键词是要跟百度分词完全匹配的,在完全匹配中又会根据文件URL路径的深度来进行排序,在关键词都完全匹配的情况下,比如说目录比文件有优先权,根目录下的文件要比二级目录下的文件有优先权,完全匹配的会排在前面,然后再是部分匹配的。

2、在关键词没有完全匹配的情况下,如果有分词,比如说:“SEO资料库”这个关键词,有一个网页里第一次出现的关键词是“SEO”,并且有较高的关键词密度,但是这个网页中却没有”资料库“这个关键词,而另一个网页里第一次出现的关键词是“资料库”,那么这个网页的关键词就会被拆分成 “SEO” “资料库” 两个词,虽然第二个网页里包含有“SEO” “资料库” 但是第一个网页还是会排在第二个网页的前面,这说明关键词的前面部分是最重要的。

3、关键词第一部分出现的频率是排名的关键,比如说 ”SEO 资料库“,如果两个网页都没有完全匹配,都是含有两个分词,那么“SEO”这个分词密度高的网页将会排在前面。

4、如果完全匹配,但是关键词第一出现是在页面内容的最后面部分,那么这个网页的排名将比前面这些页面还要低。所以关键词尽早在内容中出现是非常重要的。

5、百度根据第一次出现的相关关键词切词,如果第一次出现的相关关键词是关键词的尾部,那么就从后面开始切,如果是前面部分就从前面开始切,也就是根据网页内容的顺序和反序进行分词,顺序的时候就是以关键词前半部分为起点,反序的时候就是以关键词的后半部分为起点。例如:”正浩生物科技有限公司“ 这个关键词,如果你的网页中第一次出现的关键词是”正浩生物“,那么你这个页面的关键词会被拆分成”正浩生物”和“科技有限公司”两个词。

6、可以根据百度的切词原理,自己来选择比较好作的关键词头部(也就是调整你网页内容中第一次出现的关键词)。也就是进行人为切词,百度会进行从前往后判断,也会从后往前面切。

7、如果在关键词没有完全匹配的情况下,并且关键词出现得不完整,比如说:正浩生物科技有限公司,网页的内容包含的关键词中如果没有“正浩”这个词,那么切词就会从“生物”开始,但是这样的网页都会排在比较靠后了,因为你关键词的前部分都没有包含。

8、缺词的情况下下,如果与不缺词的网页进行比较的话,那还是根据切词前部分的密度进行排序,也就是说按照切词的顺序,如果切出来的词,前部分的密度比后部分的密度比例是关键,例如一个网页中,前部分与后部分关键词的比例是1:2,另外一个网页的比例是1:4,那么当然前面的那个网页排名要靠前。同样在缺词的情况下,切出来前词短的排名有优势。

希望以上这些能帮助大家了解百度的关键字排名规则。

本文由 www.lunce.net 站长论策首发 转载请留链接,谢谢!