假设以下这两个链接,内容其实差不多,那么第一个链接就应该屏蔽掉。
/123.html
像第一个的链接这样的链接非常多,那么我们要怎么屏蔽呢?其实只要屏蔽/XXX?就可以屏蔽所有的链接了。
代码如下:
同理,一些没有内容的页面我们也可以利用相同的办法将其屏蔽掉。
2、用robots.txt屏蔽多余的链接,一般保留静态的链接(既HTML、htm、shtml等)。
由于网站中经常会出现多个链接指向同一个页面的情况,而这样会让搜索引擎对网站的友好度降低。为了避免这一个情况,我们就可以通过robots.txt把 非主要的链接去掉。
比如以下两个链接指向同样的页面:
/OOO?123
那么我们就应该去掉第一个垃圾,代码如下:
Disallow: /OOO?123
3、用robots.txt屏蔽死链
死链就是曾经存在的网页,因为改版或其他原因而失去效用后就变成死链,也就是说看似一个正常的网页链接,但点击后不能打开相对应的网页页面。
比如,原来在目录为/seo下的所有链接,因为目录地址的改变,现在都变成死链接了,那么我们可以用robots.txt把他屏蔽掉,代码如下:
Disallow: /seo/
4、告诉搜索引擎你的sitemap.xml地址 做网站,网站建设
利用robots.txt可以告诉搜索引擎你sitemap.xml文件的地址,而不需要在网站上添加sitemap.xml的链接。具体代码如下:
Sitemap: 你的sitemap地址
以上就是robots.txt的基本用法,一个好的网站必定会有一个好的robots.txt,因为robots.txt是搜索引擎了解你网站的一 个途径。另外在这里我推荐一下一个比较适合wordpress用户使用的robots.txt写法:
User-agent: *
Disallow: /feed/
Disallow: /comments/feed
Disallow: /trackback/