百度快照是指百度搜索引擎在爬取网站时自动保存下来的网页副本,以方便用户在搜索结果中快速查看网页内容。然而,某些网站的信息可能已经过时或已经不再适用,此时快照会变得无用甚至造成误导。因此,有时候我们需要彻底删除百度快照。那么,下面就为大家介绍几种有效方法解决百度快照问题。
一、网址屏蔽法
通常情况下,百度快照是通过网址来生成的,因此阻止其网址访问的方式就能够解决快照的问题。具体方法如下:
1. 打开robots.txt文件
robots.txt文件通常位于网站的根目录下,用来指定搜索引擎的爬虫哪些页面能够访问,哪些页面不能访问。如果想要删除快照,可以通过修改robots.txt文件来实现。
2. 添加屏蔽语句
打开robots.txt文件后,需要添加指令来屏蔽百度快照的爬取。可在文件末尾添加以下语句:
User-agent: Baiduspider
Disallow: /
这里的User-agent指代的就是百度的爬虫,而Disallow则表示禁止该爬虫访问所有页面。这样一来,百度快照就不会再次生成了。
3. 通知百度
完成上述操作后,还需要向百度提交清除网站快照的请求,具体步骤如下:
①进入百度快照清除页面
https://ziyuan.baidu.com/linksubmit/index
②在“我要提交”中选择“清除快照”
③输入要清除的网址和快照链接
④选择合适的原因,填写验证码并提交
二、更新网页内容法
有时候,快照显示的内容已经过时或不够准确,为此我们需要相应更新网站内容,以期重建新的、准确的快照。具体步骤如下:
1.发现含有过时信息的页面
首先要找出含有过时信息的页面,可以通过百度快照搜索或者自己浏览网站找到(网页的标题通常是上次生成快照时的日期)。
2.修改网页内容
对于找到的网页,我们需要对其中的旧内容进行修改。修改后,百度爬虫会重新抓取网页,生成新的快照。
3.通知百度
完成信息修改之后,还需要通知百度,让它重新扫描已经更新了的网页。具体步骤可以参考上面提到的网址屏蔽法中的通知百度的操作。
三、通过robots.txt文件更新法
如果是由于网站结构和内容改版导致百度快照过时,而又不能更新整个网站,那么通过修改robots.txt文件来更新快照可能是一种更有效的方式。
1.确定已更新的页码
首先需要确定哪些页面已经完成了更新,这样能够避免无效的操作。
2.修改robots.txt文件
此时,与其通过屏蔽的方法禁止百度爬虫访问所有页面,不如只针对已更新的页面列表来设置robots.txt文件,让百度爬虫只抓取最新的内容。假设已经完成更新的页面有/about.html、/products.html、/contact.html三个页面,只需要如下修改robots.txt文件:
User-agent: Baiduspider
Disallow: /about.html
Disallow: /products.html
Disallow: /contact.html
这样可以帮助百度尽快识别并更新快照,避免用户误导。
四、通知百度二度删除法
如果通过上述方法还是无法解决问题,那么可以通过通知百度二度删除快照来解决。具体步骤如下:
1.进入百度搜索反馈页面
https://github.com/BaiduSitemapGenerator/BaiduSitemapGenerator/wiki/%E5%B8%B8%E8%A7%81%E5%95%8F%E9%A2%98
2.选择“快照问题”
3.填写相应信息,成为“百度站长”
4.完成后通知百度提交删除请求
需要注意的是,此方法要求你必须是网站的拥有者或管理员才能发起请求。
总之,任何理由下的百度快照都可以被删除,关键是选择正确的方法和正确的步骤,同时也需要有耐心等待百度更新。
TAGS: 彻底删除百度快照的技巧解决百度快照问题的有效方法掌握如何彻底清除百度快照快速有效地删掉百度快照