找回密码
 开放注册

QQ登录

只需一步,快速开始

微信登录

微信扫码,快速开始

搜索
查看: 260|回复: 3

搜索引擎的工作原理是什么?

[复制链接]

175

主题

102

回帖

471

牛毛

一级牛人

积分
471
发表于 2014-11-22 10:49:53 | 显示全部楼层 |阅读模式 来自 河北省唐山市
  首先,解释一下SE(搜索引擎)的工作原理。
  搜索引擎的工作流程大致可以分成三个阶段。
  (1)爬行和抓取:搜索引擎机器人(蜘蛛)通过跟踪链接访问网页,获得页面HTML代码存入数据库。
  (2)预处理:索引程序对抓取来的页面数据进行文字提取、中文分词、索引等处理,以备排名程序调用。
  (3)排名:用户输入关键词后,排名程序调用索引库数据,计算相关性,然后按一定格式生成搜索结果页面。
  搜索引擎爬去工具,百度的百度蜘蛛(Baiduspider),谷歌的谷歌机器人(googlebot)等,
  搜索引擎通过这些爬取工具,浏览众多的网页,收录有质量的网页。
  搜索引擎的工作原理大致可以分为:
  搜索引擎工作原理详细的解释如下:
  1. 搜集信息:搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛的自动搜索机器人程序来连上每一个网页上的超连结。机器人程序根据网页链到其他中的超链接,就象日常生活中所说的“一传十,十传百……”一样,从少数几个网页开始,连到数据库上所有到其他网页的链接。理论上,若网页上有适当的超链结,机器人便可以遍历绝大部分网页。
  2. 整理信息:搜索引擎整理信息的过程称为“建立索引”。搜索引擎不仅要保存搜集起来的信息,还要将它们按照一定的规则进行编排。这样,搜索引擎根本不用重新翻查它所有保存的信息而迅速找到所要的资料。想象一下,如果信息是不按任何规则地随意堆放在搜索引擎的数据库中,那么它每次找资料都得把整个资料库完全翻查一遍,如此一来再快的计算机系统也没有用。
  3. 接受查询:用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回资料。搜索引擎每时每刻都要接到来自大量用户的几乎是同时发出的查询,它按照每个用户的要求检查自己的索引,在极短时间内找到用户需要的资料,并返回给用户。目前,搜索引擎返回主要是以网页链接的形式提供的,这些通过这些链接,用户便能到达含有自己所需资料的网页。通常搜索引擎会在这些链接下提供一小段来自这些网页的摘要信息以帮助用户判断此网页是否含有自己需要的内容。

已绑定手机

186

主题

7145

回帖

1401

牛毛

VIP推广永久卡

http://www.gxcpcb.com 硅芯创科技

积分
1422
QQ
发表于 2014-11-22 11:49:15 | 显示全部楼层 来自 广东省深圳市罗湖区
搜索引擎的信息搜集基本都是自动的

11

主题

3845

回帖

166

牛毛

一级牛人

积分
166
发表于 2014-11-22 14:32:28 | 显示全部楼层 来自 广东省广州市
···········努力 加油 实干 执行力··············

0

主题

2117

回帖

558

牛毛

一级牛人

积分
558
发表于 2014-11-24 10:32:55 | 显示全部楼层 来自 河北省石家庄市
搜集信息:搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛的自动搜索机器人程序来连上每一个网页上的超连结。
您需要登录后才可以回帖 登录 | 开放注册

本版积分规则

帮助|Archiver|小黑屋|通信管理局专项备案号:[2008]238号|NB5社区 ( 皖ICP备08004151号;皖公网安备34010402700514号 )

GMT+8, 2025-1-18 18:18 , Processed in 0.126793 second(s), 32 queries , Yac On.

Powered by Discuz! X3.5

快速回复 返回顶部 返回列表