|
百度对于收录页面是通过网站入口URL的联通成一个网状,然后百度的抓取功能是被称为“百度蜘蛛”的工具在进行收集,那么这个百度蜘蛛的收集器就是网站页面收录的关键。怎么才能更容易的被百度蜘蛛发现与收录呢?百度蜘蛛的计算原理目前我的了解有限,百度蜘蛛并不是人,它没有思考能力,它只是根据命令与设定的规则来行动。
据我经验了解百度蜘蛛的收录规则:
1.原创内容
这是唯一的最为重要的点,百度蜘蛛在每天每天的运作它会记录起所有的内容性质,那么在爬取的时候就会进行筛选,而第一无二的原创文章则是百度蜘蛛最喜欢的被称为“蜘蛛食量”。由于百度蜘蛛对内容是没有理解能力的,它只对词语进行判断,那么在题目与文章内容里我们就要增加词语的密度与联系。作为现在的百度来说相关度高的文章容易被收录。建议:如伪原创文章前200个字是蜘蛛判断是否原创的关键。
2.蜘蛛通道的建设
百度每天会发出很多的蜘蛛去收集内容供应搜索引擎的更新,那么百度蜘蛛的通道就是URL。蜘蛛通过搜索引擎的URL进行行动,那么我们网站就要给出大量的门让蜘蛛进入到网站来,尽量多的让蜘蛛带走我们的内容,那么那些地方才是蜘蛛喜欢去的呢?我们在选择做外链引蜘蛛的时候要考虑到,蜘蛛喜欢的是一些内容更新多,活跃度高的网站:例如(论坛,门户,社区等)。
3.养蜘蛛
这是很多SEO做的工作,养蜘蛛就是让百度蜘蛛喜欢网站,从而经常来网站,这样就能很好的收录网站内容。具体怎么做呢?根据蜘蛛的规则:原创文章、外部URL之外,这个更新时间与更新频率尤其重要,我自己的经验是每天早上8:30-10:30之间发布文章是非常好的,因为这样一天里就有尽量多的时间让蜘蛛接触新内容,方便蜘蛛抓取。更新的时候不要过于不定时的发,在更新时段里进行发布。在收录的快慢情况下,进行下一时段的发布,如果前面发布的文章很快被收录之后再下午3:00-5:00之后时在进行发布。我的了解是,一次性增加10-20篇文章是会出现漏洞的,就是蜘蛛只抓取一部分。坚持一段时间蜘蛛的抓取就能得以控制。在第一时段更新之后,发现没有被收录的文章,在第2时段前,我们可以进行修改,增取在第2时段被收录。
由私彩平台www.llakxd.com整理收集llakxd发布
|
|