找回密码
 开放注册

QQ登录

只需一步,快速开始

微信登录

微信扫码,快速开始

搜索
查看: 520|回复: 1

分析404页面抓取错误的问题

[复制链接]

580

主题

-255

回帖

728

牛毛

一级牛人

积分
728
发表于 2014-12-8 19:01:30 | 显示全部楼层 |阅读模式 来自 广东省广州市
网站改版都是期望网站可以很好的进行优化,可是关于网站改版的不一样期间,搜索引擎会对网站进行不一样的需求。通常网站改版后,对网站的优化都会形成一些影响,这个时分,就进行有效地操控,削减改版形成的404页面过多状况。假如搜索引擎对网站的404过错页面抓取过多,就会导致网站有也许被降权,这对以后网站权重的恢复也会形成很大的影响。下面具体的跟我们剖析下404页面的处理状况。
1、运用日志剖析东西找到404过错抓取页面
想要晓得搜索引擎有没有到网站抓取,到网站抓取多少页面,抓取了哪些页面。这时就需要对网站的日志进行剖析。关于网站日志的观点对比艰难,就可以运用光年日志进行转化。首要运用FTP下载好近来几天的网站LOG日志,当然,想更多的剖析,那么多下载一段时间的LOG日志也可以,运用日志剖析东西新建任务剖析各个期间的baidu蜘蛛抓取状况。
2、运用baidu站长死链提交东西进行死链提交
关于404页面同,baidu搜索引擎是怎么进行了解的呢?事实上,关于404页面。baidu搜索引擎以为404状况码代表‘Not Found',spider更新时会以为该页面已失效,此刻呢将在索引库中删去,短期内spider再次发现该url不再见抓取。可是假如通过网站日志就可以发现,关于404页面,baidu蜘蛛仍是会进行抓取的,这也是为何网站改版以后,baidu蜘蛛仍是会对404过错页面进行一些抓取。
3、运用robots.txt和nofollow标签引导蜘蛛抓取
网站存在过错页面时,baidu蜘蛛就会抓取 到一部分的过错页面。浪费了蜘蛛抓取资本,而关于网站的准确页面抓取就会削减一部份。这就形成页面的资本丢掉。这时站长就需要对baidu蜘蛛进行一些引导,让蜘蛛抓取想让他抓的一些页面,关于一些404页面进行robots约束抓取,关于网站中一些不参加排行的连接实施nofollow,引导蜘蛛抓取重要页面。
本文来自: 杭州金鼎轩交流网,更多内容请移步:http://www.agedbill.com

已绑定手机
已实名认证

7

主题

1058

回帖

2324

牛毛

二级牛人

积分
2324
发表于 2014-12-8 20:32:27 | 显示全部楼层 来自 河北省石家庄市
细节决定成败!
您需要登录后才可以回帖 登录 | 开放注册

本版积分规则

帮助|Archiver|小黑屋|通信管理局专项备案号:[2008]238号|NB5社区 ( 皖ICP备08004151号;皖公网安备34010402700514号 )

GMT+8, 2025-1-20 12:04 , Processed in 0.118791 second(s), 26 queries , Yac On.

Powered by Discuz! X3.5

快速回复 返回顶部 返回列表