找回密码
 开放注册

QQ登录

只需一步,快速开始

微信登录

微信扫码,快速开始

搜索
查看: 238|回复: 0

robots.txt到底能不能屏蔽百度蜘蛛

[复制链接]
已绑定手机
已实名认证

2136

主题

-532

回帖

5144

牛毛

二级牛人

积分
5144
发表于 2014-10-17 22:04:04 | 显示全部楼层 |阅读模式 来自 山东省临沂市
关于404页面的问题
问题补充:当我们由于变更产生404之后,百度会间隔多长时间识别出来?并且需要识别几次才会将其删除?对有些尚未做好的专题页面,可能会临时设置为404页面,之后很快将页面恢复,但这些专题页面中有一部分很快就能够恢复,还有一部分就需要很长时间才可被收录,因此有重大新闻时,会紧张重大专题被及时收录的情况。
官方回复:不会有固定的时间,会根据网页的和所在频道的更新频率,去确定删除的时间,未做好或者非作为死链的页面,尽量不要用404的返回码,希望尽可能用503的返回码,这样spider能够比较好的去识别。

robots.txt到底能不能屏蔽百度蜘蛛?
问题补充:我在robots.txt中设置了禁止百度收录我网站的内容,为何还出现在百度搜索结果中?
官方回复:如果其他网站链接了您robots.txt文件中设置的禁止收录的网页,那么这些网页仍然可能会出现在百度的搜索结果中,但您的网页上的内容不会被抓取、建入索引和显示,百度搜索结果中展示的仅是其他网站对您相关网页的描述。
您需要登录后才可以回帖 登录 | 开放注册

本版积分规则

帮助|Archiver|小黑屋|通信管理局专项备案号:[2008]238号|NB5用户社区 ( 皖ICP备08004151号;皖公网安备34010402700514号 )

GMT+8, 2025-1-11 08:17 , Processed in 0.114181 second(s), 22 queries , Yac On.

Powered by Discuz! X3.5

快速回复 返回顶部 返回列表