当前位置: 首页 > 图文教程 > 网站运营 > 网站优化 > google收录,注意元标记的陷阱!

网站优化
让百度一星期内收录方案 博客收录总结
新站百度只收录首页后又删除的解释
预测日IP上万的最新关键词
SEO 经验总结
wordpress 博客永久链接完整rewrite规则
搜索引擎 判断原创文章的一些猜测
google 已经可以抓取flash加载的外部资源
Google 官方对链接nofollow的政策
百度7月22日大更新研究 百度算法彻底改变
7月26日 百度算法再次波动的处理方法
近期百度大违常理排名全面解析
百度排名的一些初步分析
近日百度连续K站拔毛的原因分析
如何看待近日的百度调整算法事件
SEO基础之建立网站地图
另类的新站推广方法
网站优化 学习笔记
微软 Bing(必应)seo优化的建议
SEO 网页中需要重点强调的内容
认识搜索引擎优化(SEO)

网站优化 中的 google收录,注意元标记的陷阱!


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-10-17   浏览: 126 ::
收藏到网摘: n/a

相信很多站长都知道robots吧,(不知道的搜一下),但是很多站长却忽略了元标记也可以阻止网站的收录。

我的博客地址是ourys.com,域名原来是一个电影网站,最后我没有做电影网站,一心做自己的博客网站。但是过了一个多月,google收录的还是我以前的网站,而且一直保持在原来的数量。我一直很相信google收录的速度,比别的搜索引擎快很多,但是别的搜索引擎都收录了,google却还是没有动静,用了google的网站管理员工具,sitmap没有问题(注意如果你是网站管理者切记使用google的管理员工具,让收录由被动变主动),反复提交了好多次,等了很久很久一点反应都没有,还用了google的reader工具(新站注意用一下,可以让google很快的检查到你网站的更新),一切的一切都没有动静,在管理员工具中看到的google爬虫确实又来到了自己的网站,这就让我纳闷了。最后没有办法,直接到了google网站管理员支持论坛把这个问题提出来了,两个小时左右就得到了google的回答,这是回答内容:

Hector 你好,

你的网站收录问题,是因为我在你的网页上看到的下面一段代码:

<meta name='robots' content='noindex,nofollow' />

关于noindex元标记,你可以参考下面这篇文章。

所以,你可以将这段代码去掉,过一段时间Google就会重新收录你的网页,网页摘要也会得到更新了。

引用:

以下为引用的内容:

要完全阻止网页内容列入 Google 的网络索引中(即使其他网站链接到此网页),可使用 noindex 元标记。 只要 Googlebot 提取网页,便会看到 noindex 元标记并阻止该网页显示在网络索引中。 Google 网络索引还允许使用 robots.txt 文件中的"Noindex:" 来阻止未抓取网址链接的引用显示在我们的网络搜索结果中。

noindex 元标记标准在 http://www.robotstxt.org/meta.html 上进行了说明。 如果您不具备对服务器的根访问权限,此方法将非常有用,因为它允许您逐页控制对网站的访问。

要阻止所有漫游器将您网站上的网页编入索引,请将以下元标记放入网页的 部分:

要允许其他漫游器将您网站上的网页编入索引,仅阻止 Google 的漫游器将网页编入索引:

如果看到某一页面上有 noindex 元标记,Google 就会将此页面从我们的搜索结果中完全丢弃,不管是否还有其他页面链接到它。 但是,其他搜索引擎可能会以不同的方式解译此指令。 因此,指向网页的链接可能仍会显示在搜索结果中。

请注意,由于我们必须抓取您的网页才能看到 noindex 元标记,因此在极少数情况下 Googlebot 可能会看不到和不遵循 noindex 元标记。 如果您的网页仍在结果中显示,可能是因为在您添加标记之后我们尚未抓取过您的网站。 (此外,如果您还在使用 robots.txt 文件拦截此网页,我们也无法看到此标记。)

如果内容当前出现在我们的索引中,我们将在下次抓取此内容时将其删除。 要加快删除过程,请使用 Google 网站管理员工具中的网址删除请求工具。

总结以上,是因为我用的网站模版里面有了<meta name='robots' content='noindex,nofollow' />这段代码,去掉之后google收录就正常了,希望广大站长遇到问题时不要到处责骂,找到问题的解决方法最关键,大家有什么问题可以到我博客(http://ourys.com)上留言,希望我可以尽自己的微薄之力为你分忧。