当前位置: 首页 > 图文教程 > 网站运营 > 网站优化 > 搜索引擎是如何确定你的内容就是原创内容

网站优化
flash对seo的影响分析
更新网站百度快照的方法 关键词与外链
可以增加关键字密度几种好方法
导致网站被百度降权的常见因素分析
SEO 策略 搜索引擎 排名
Flash 网站优化有窍门
SEO 优化需要兼顾用户体验设计
不容忽视的SEO优化细节
SEO第一名 只能是谎言
个人站长推广经验与技巧小结
百度快照 频频停止 几种原因分析
微软Bing搜索引擎 网站提交
Bing 网站管理员工具使用指南
国外 SEO优化 几个知识
Web 图片优化技巧总结
SEO 初学者必读
写软文离不开文字功底和素材的说明
SEO 初学者需要掌握的几个基本技能
Google 网页质量 评估 分析
百度对于新站平稳收录的一些技巧分享

网站优化 中的 搜索引擎是如何确定你的内容就是原创内容


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-10-17   浏览: 43 ::
收藏到网摘: n/a

很多人在群里聊到一些事情,比如原创是如何被搜索引擎确定的?核桃今天分享一下自己对搜索引擎确定原创内容的看法。

首先我们明确两个概念:原创与伪原创

原创:简单地理解就是第一次在网络上发表的内容。

伪原创:就是对原创进行的第二次或者第N次经过修改的转载发表。比如修改标题,增加摘要,转载不完整内容等等。

搜索引擎对于原创的判断是如何进行的呢?

一般来讲有以下几个方面的因素决定:

1、快照日期。

2、蜘蛛抓取日期。

3、页面外链的多少。

4、文章修改的程度。

举例:如果一篇标题为《搜索引擎如何确定你的就是原创内容》的文章在今天10点第一次发表在一个博客或者网站上。会有什么结果呢?

搜索引擎蜘蛛来到这个博客或者网站,发现这个页面,分析内容,放入数据库,并且被确定为首次发现,这肯定就是原创了!

那么这个收录与判断的过程中间有几个细节方面问题:

1、必要条件

——假如这个网站没有被收录,这篇文章会认为是原创吗?

——当然不是!因为它根本不可能出现在搜索数据库里!

——如何让它成为原创内容?

——第一个条件,网站必须有被搜索引擎收录。

——假如这个网站收录了,但是不经常更新呢?

——很简单,如果不经常更新,发表的文章到收录的时候也会认为是原创的。

3、转载与采集

——如果文章被转载了呢?

——如果文章被转载,那么看转载这篇文章的站更新周期与首次发表站的更新周期哪个更快。

——不太明白更新周期。

——比如在A站发表,B站转载,如果蜘蛛先访问了A站,发现了文章,再来到B站发现了文章,很明显的,原创权重归A站。

——采集的情况是否符合这种情况?

——是的,采集的情况一样。如果B采集A,但B收录比A早,B就可能变成原创喽!

4、访问时间

——如果蜘蛛先访问了B站呢?

——当然权重给B站,一般的情况下都会这样!

——如果B站转载的文章带了A站的原文章页面链接呢?

——这就很明白了,刚收录的时候,如果排名,两条结果一起出现,有可能还是B站的排名好一点。

当然,文章转载次数多了以后,A站的链接越多,对A站的文章越有好处,排名会慢慢变成A站在前面。

——如果另外转载的文章带的是B站页面的链接呢?

——这种情况就搞笑了,给搜索引擎开了个玩笑,但它们如果判断不好,就变成了一个链接流行度的比赛了。

不过,如果都有很多外部链接,并且相差不大,那么判断的规则应该回到原点,谁先被收录谁就是原创。

5、快照日期

——快照日期显示时间最早的,一般就是原创了吧!

——不一定,这个说法要在一个更新周期之内,比如说文章发表后一周内,快照时间越早的地址将越有被认可为原创的可能。

但如果文章都发表了几个月了,说不定搜索引擎已经重新获取过快照了,快照的日期就变了!

——还有其它的可能吗?

——有,一般比如百度收录,他可能会有一个收录的数据库,经过过滤后,收录的内容才会到搜索结果里来。在这个期间就有一些问题了,比如A站首次发表,B站转载。蜘蛛先访问A站再访问B站。而后可能先把B站的结果放出来了,而A站还在数据库里。

所以说搜索引擎没有收录并不表示搜索引擎蜘蛛没有访问过这些内容,也许在搜索引擎的库存里已经有记录了,只是你查的时间没有放出来而已,就像25号才放出来的内容,但是快照是20号的,这就是搜索引擎的库存内容,同时这也是检验原创的核心时间点。

这种情况一般出现在新站与老站之间,A站发表,B站转载,但A站在搜索引擎的信任度并不高的时候。不过只要是A站先被访问到的,原创权还是A站的,这是最难分出来的情况,因为我们不知道蜘蛛先访问哪个站,除非你知道两个站的网站空间日志内容,能看到搜索引擎对两个页面的访问时间。

6、伪原创

——伪原创也会被认为是原创?

——大多时候是这样的,搜索引擎蜘蛛智力相当于三岁小孩子一样,不能明确分别这些东西,因为它的思维太程式化了。如果你的标题改过,文章的段落改过,那么蜘蛛将很难确定这篇文章是否有过收录,也许它可以确定有部分内容是重复的,但它也不能因为这些而将这篇文章确认为是转载!当然,随着搜索引擎程式设计的提高,应该会有一个相似度的东西出来,比如文字内容相似度超过百分之几就会被认为是转载。

这样分析下来,相信大家应该了解了吧。只是核桃自己的看法,希望大家吸收自己想要的东西,不认同的了也来提下自己的意见!

另外提几个建议:

1、如果你的站是新站,权重不高,如何让蜘蛛首页找到你的页面并放入数据库?其实很简单:用网摘、百度收藏这些工具让蜘蛛更快的找到你的页面!

2、大家都有过建议,就是加上自己的版权及内容页面的地址,别人采集的时候你就爽了,收录虽然不会快,但最后链接多了,你依然是原创内容。

3、发表文章等到自己收录以后再去其它的站点进行发表,同时加上自己的原文地址,这种办法很有保障!大站被采的机率很大!