博客首页  |  [网络推广]首页 

网络推广
博客分类  >  其它
网络推广  >  推广
搜索处理的基本流程

31772

搜索处理的基本流程,为什么我搜一下某个词,搜索会给我们那样的结果 ,这个过程是如何完成的,现在简单的谈一谈搜索处理的基本流程。
第一步:抓取,这个过程基本主要是我们的内容被搜索抓取,抓取主要由爬虫来执行,爬虫,有的称为蜘蛛实际上是搜索的一个程序,不同的搜索的这个程序是不一样的,Google的蜘蛛: Googlebot 百度的蜘蛛:baiduspider. Yahoo的蜘蛛:Yahoo Slurp MSN的蜘蛛:Msnbot ,同一个搜索也可能有多个蜘蛛。针对这个抓取过程,大家可以把文章通过ping服务自动发送到搜索,这个对博客优化非常有效的。提醒一点,如果 FLASH,网站内容要注册才能看到的,JS等一般不被抓取,如我在这里发的内容,大家不能在外面不要任何权限就可以看到的话,就可能被抓取,反之,一般不会抓取。facebook twitter是个例外,他们与GOOGLE有深度合作,是可以抓取的,同时他们的内容通达API也可以让浏览者直接看到。
第二步:排序,抓取到内容后就要排序了,以便确定那个网站在什么关键字中排在前面,这个是算法的中心,一般小的,新的关键字不入库,但是热门的词会排序,这里要计算外链,关键字分布等等。还有相关域,以便确实那个词,那个站在前面。
第三步:检索,这个过程就用户输入关键字,搜索得出结果过程。

 签名:关注法轮功就是关注自己,祝福李洪志先生!

 

给本文章评分:
    留言:
留言簿(游客的留言需要审核后发表。请遵守基本道德。) >>