如今很多人都有个自己的独立博客,特别是seoer们,一来可以体现自己的seo能力,一来还可以接下seo单,由于zblog本身的优化还不错,所以很多人用,但zblog还是有些没有照顾到seo的细节,因此还是需要我们手动改下。
现在就说说robots.txt文件,在zblog源文件默认是没有Robots.txt这个文件的,所以我们应该手工创建robots.txt文件, 通过robots.txt语法禁止搜索引擎收录一些不必要的页面,以“清洁”收录,提高质量。
如果不理解什么是robots.txt文件,清看:robots.txt的概念?
在zblog中,诸如评论等页面都是可以禁止搜索引擎收录的,评论和留言页面历来是黒帽SEO的主战场,所以我们第一步就是将它们给清扫了。以下是一个robots.txt案例,大家可以简单参阅。
User-agent:*
#Sitemap
Sitemap:http://www.gz3a88.cn/sitemap.xml //这个指引搜索引擎蜘蛛找到你的Sitemap,在Google管理员工具中检测提示错误,这是Google Robots.txt的一个BUG,事实上是有效果且正确的。
#Directories
Disallow:/ADMIN/ //管理员登陆入口,后台的页面就不让搜索引擎进来吧。
Disallow:/SCRIPT/ //我们调用的SCRIPT文件,就算搜索引擎抓到了,它也不会读。
Disallow:/PLUGIN/ //插件目录,不需要抓取。
Disallow:/FUNCTION/ //这是些JS之类的文件也不需抓取。
Disallow:/UPDATE/ //Zblog官方的升级信息目录,不需抓取。
Disallow:/ARTICLE-IMAGE/ //网站模板中用到的一些小图标,这些在网上到处都是,就是让搜索引擎抓去了也没有排名,还浪费你的资源。
Disallow:/DATA/ //里面放的是数据库,就算搜索引擎抓到了,它也不会读。
Disallow:/CACHE/ //Zblog生成静态页的缓存目录,这个和你的正常文章基本一致,高重复,建立拿掉。
Disallow:/STYLE/ //CSS生成目录,不需抓取。
Disallow:/TEMPLATE/ //模板目录,不需抓取。
Disallow:/CSS/ //CSS的一些调用文件目录,不需抓取。
Disallow:/LANGUAGE/ //语言目录,不必抓取。
#Files
Disallow:/login.asp //我们的登录后台文件,不需抓取。
Disallow:/cmd.asp? //这个是供别人引用通知时产生的页面,不需抓取。
Disallow:/search.asp //搜索页,这页在没有人使用时,就是一个空页
Disallow:/atom.xml //支持ATOM的FEED页,高重复。
Disallow:/rss.xml //支持RSS的FEED页,高重复。
Disallow:/view.asp? //一般后台预览时生成的页面,高重复。
如果你不理解上面的,也没关系,把上面的全部复制上去就可以了,绝对只有好处没有坏处。