找回密码
 开放注册

QQ登录

只需一步,快速开始

微信登录

微信扫码,快速开始

搜索
查看: 406|回复: 2

如何吸引百度蜘蛛的抓取

[复制链接]

78

主题

5

回帖

178

牛毛

一级牛人

积分
178
发表于 2014-12-5 10:31:34 | 显示全部楼层 |阅读模式 来自 重庆市
百度对于收录页面是通过网站入口URL的联通成一个网状,然后百度的抓取功能是被称为“百度蜘蛛”的工具在进行收集,那么这个百度蜘蛛的收集器就是网站页面收录的关键。怎么才能更容易的被百度蜘蛛发现与收录呢?百度蜘蛛的计算原理目前我的了解有限,百度蜘蛛并不是人,它没有思考能力,它只是根据命令与设定的规则来行动。
   据我经验了解百度蜘蛛的收录规则:
   1.原创内容
    这是唯一的最为重要的点,百度蜘蛛在每天每天的运作它会记录起所有的内容性质,那么在爬取的时候就会进行筛选,而第一无二的原创文章则是百度蜘蛛最喜欢的被称为“蜘蛛食量”。由于百度蜘蛛对内容是没有理解能力的,它只对词语进行判断,那么在题目与文章内容里我们就要增加词语的密度与联系。作为现在的百度来说相关度高的文章容易被收录。建议:如伪原创文章前200个字是蜘蛛判断是否原创的关键。

   2.蜘蛛通道的建设
   百度每天会发出很多的蜘蛛去收集内容供应搜索引擎的更新,那么百度蜘蛛的通道就是URL。蜘蛛通过搜索引擎的URL进行行动,那么我们网站就要给出大量的门让蜘蛛进入到网站来,尽量多的让蜘蛛带走我们的内容,那么那些地方才是蜘蛛喜欢去的呢?我们在选择做外链引蜘蛛的时候要考虑到,蜘蛛喜欢的是一些内容更新多,活跃度高的网站:例如(论坛,门户,社区等)。

    3.养蜘蛛
    这是很多SEO做的工作,养蜘蛛就是让百度蜘蛛喜欢网站,从而经常来网站,这样就能很好的收录网站内容。具体怎么做呢?根据蜘蛛的规则:原创文章、外部URL之外,这个更新时间与更新频率尤其重要,我自己的经验是每天早上8:30-10:30之间发布文章是非常好的,因为这样一天里就有尽量多的时间让蜘蛛接触新内容,方便蜘蛛抓取。更新的时候不要过于不定时的发,在更新时段里进行发布。在收录的快慢情况下,进行下一时段的发布,如果前面发布的文章很快被收录之后再下午3:00-5:00之后时在进行发布。我的了解是,一次性增加10-20篇文章是会出现漏洞的,就是蜘蛛只抓取一部分。坚持一段时间蜘蛛的抓取就能得以控制。在第一时段更新之后,发现没有被收录的文章,在第2时段前,我们可以进行修改,增取在第2时段被收录。
由私彩平台www.llakxd.com整理收集llakxd发布

11

主题

3845

回帖

166

牛毛

一级牛人

积分
166
发表于 2014-12-5 10:57:03 | 显示全部楼层 来自 广东省广州市
·········努力 加油 坚持 实干执行力··············
您需要登录后才可以回帖 登录 | 开放注册

本版积分规则

帮助|Archiver|小黑屋|通信管理局专项备案号:[2008]238号|NB5社区 ( 皖ICP备08004151号;皖公网安备34010402700514号 )

GMT+8, 2025-1-20 03:41 , Processed in 0.124012 second(s), 29 queries , Yac On.

Powered by Discuz! X3.5

快速回复 返回顶部 返回列表