当前位置: 首页 > 图文教程 > 网站运营 > 网站优化 > 分词切词研究(实例篇)

网站优化
SEO 搜索引擎收录页面流程原理和方式
SEO 分析某关键词的竞争强度的方法
新手站长找外部链接和简单网站推广方法
SEO实例经验分享 搜索引擎分词和长尾
DEDECMS 网站优化4则细节
Google 处理采集数据的一些分析
SEO不容易 开始给SEO吹冷风
Tags 标签优化细节问题
选择关键词的心得和思路
site 域名首页是在第一四种原因
网站找好链接的6种方法
三天优化到百度第一等类似信息纯属骗人
SEO实验 不要过于相信搜索引擎内部人的话
让排名在百度更稳定
百度 反垃圾网站的若干问答
搜索引擎重复网页发现技术分析
站内链接对蜘蛛收录的负面影响以及对策
免费网站推广诀窍 多干体力活儿
SEO 准确的进行关键词的选取
SEO 更新网站内容时注意的链接策略

网站优化 中的 分词切词研究(实例篇)


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-10-17   浏览: 50 ::
收藏到网摘: n/a

这篇文章论策讨论的是中文分词技术,对seo具有指导意义。可以通过中文分词的研究获得百度的长尾流量。

1、百度分词是根据内容中,第一次出现关键词相关词为标准来分的。例如”正浩生物科技有限公司“这个词

如果你的正文中第一个出现的是”正浩“这个词,那么你的页面上的关键词就会被拆分成”正浩”和“生物科技有限公司“两个词,标题中一定要包含关键词,但不一定要完全匹配,但内容中出现的关键词是要跟百度分词完全匹配的,在完全匹配中又会根据文件URL路径的深度来进行排序,在关键词都完全匹配的情况下,比如说目录比文件有优先权,根目录下的文件要比二级目录下的文件有优先权,完全匹配的会排在前面,然后再是部分匹配的。

2、在关键词没有完全匹配的情况下,如果有分词,比如说:“SEO资料库”这个关键词,有一个网页里第一次出现的关键词是“SEO”,并且有较高的关键词密度,但是这个网页中却没有”资料库“这个关键词,而另一个网页里第一次出现的关键词是“资料库”,那么这个网页的关键词就会被拆分成 “SEO” “资料库” 两个词,虽然第二个网页里包含有“SEO” “资料库” 但是第一个网页还是会排在第二个网页的前面,这说明关键词的前面部分是最重要的。

3、关键词第一部分出现的频率是排名的关键,比如说 ”SEO 资料库“,如果两个网页都没有完全匹配,都是含有两个分词,那么“SEO”这个分词密度高的网页将会排在前面。

4、如果完全匹配,但是关键词第一出现是在页面内容的最后面部分,那么这个网页的排名将比前面这些页面还要低。所以关键词尽早在内容中出现是非常重要的。

5、百度根据第一次出现的相关关键词切词,如果第一次出现的相关关键词是关键词的尾部,那么就从后面开始切,如果是前面部分就从前面开始切,也就是根据网页内容的顺序和反序进行分词,顺序的时候就是以关键词前半部分为起点,反序的时候就是以关键词的后半部分为起点。例如:”正浩生物科技有限公司“ 这个关键词,如果你的网页中第一次出现的关键词是”正浩生物“,那么你这个页面的关键词会被拆分成”正浩生物”和“科技有限公司”两个词。

6、可以根据百度的切词原理,自己来选择比较好作的关键词头部(也就是调整你网页内容中第一次出现的关键词)。也就是进行人为切词,百度会进行从前往后判断,也会从后往前面切。

7、如果在关键词没有完全匹配的情况下,并且关键词出现得不完整,比如说:正浩生物科技有限公司,网页的内容包含的关键词中如果没有“正浩”这个词,那么切词就会从“生物”开始,但是这样的网页都会排在比较靠后了,因为你关键词的前部分都没有包含。

8、缺词的情况下下,如果与不缺词的网页进行比较的话,那还是根据切词前部分的密度进行排序,也就是说按照切词的顺序,如果切出来的词,前部分的密度比后部分的密度比例是关键,例如一个网页中,前部分与后部分关键词的比例是1:2,另外一个网页的比例是1:4,那么当然前面的那个网页排名要靠前。同样在缺词的情况下,切出来前词短的排名有优势。

希望以上这些能帮助大家了解百度的关键字排名规则。

本文由 www.lunce.net 站长论策首发 转载请留链接,谢谢!