百科详情
图片加载失败

索引库

阅读:(1126) | 2017-04-23

0

索引库就类似于我们查字典时候的检索表,或者是图书馆的书目检索。Google的蜘蛛在抓取网页之后,就把这些页面放到对应的索引库里面。在用户搜索的时候,只需要到相应的检索库里面搜索相应的信息,而不是从所有的页面当中。

  • 中文名

  • 索引库

  • 类似于

  • 我们查字典时候的检索表

  • 分类根据

  • 词语

  • 用    于

  • 网络

目录

  1. 1索引库的分类方式

索引库的分类方式

编辑

索引库里用词语来分类。因为尽管互联网上的网页是不断激增的,但是每一种语言里,词语的数量都是相对固定的。比如英语就是一百多万个单词,100亿 ÷ 1百万 = 1 万;汉语是8万多个词语,100亿÷8万=12万5千。都是计算机很容易处理得过来的。

用词语来分类还有一个好处,就是可以匹配用户查询的那个词语。本来用户就是要查这个词语的,那我就按这个词语去分类就是。所以,搜索引擎的索引库,最后就是这个样子的:索引库的分类方式


作者:聚擎