360搜索是独立的搜索引擎
360搜索是独立的搜索引擎?周鸿祎专访时强调,360搜索和百度半点关系都没有,完全是创新的产物。此前,在360搜索的官方声明中,更声称“360搜索引擎是七年磨一剑,360搜索是用自有先进搜索技术打造的独立搜索引擎”。
要做独立的搜索引擎,最基础的功夫就是要让爬虫去爬全网数据。而360的爬虫是什么时候才出现的?2012年8月27日,360搜索官方微博才正式推出“360蜘蛛”,并提示站长设置允许抓取的robots.txt协议。360蜘蛛在短短半个月内索引的网页量,就足够支撑360搜索满足用户需求,成为“第二大搜索引擎”吗?360的蜘蛛难道都是传说中的“蜘蛛侠”?
可能的解释,要么是360蜘蛛以伪装的身份默默爬了七年网页,从没知会过站长;要么就是从其他搜索引擎那里“拿”了一些数据。
笔者以“site”命令把搜索范围限定在特定站点中时,还发现许多网站根本没有被360搜索蜘蛛爬过,包括新浪网、58同城等热门大站。然而搜索相关关键词时,360搜索却能展示来自这些网站的搜索结果快照。
有站长直接爆料称:“在服务器上查看蜘蛛日志,发现了很大的问题。站在7月份上线到8月16号360spider从来没有爬行,到8月17号开始出现360蜘蛛。但在360搜索中却出现8月9号的快照,那9号的快照你从哪来的?”
搜狗的报告显示,360搜索结果第一条比百度的相似度高达38%,远高于正常比例;此外明眼人都能看出来360搜索的UI与百度极为相似。如果一个搜索引擎,360搜索结果大量套用其他搜索、他的页面设计大量套用其他搜索,那它还称得上“独立搜索引擎”吗?
搜索引擎,最基础的功夫就是要让爬虫去爬全网数据
页:
[1]