elasticsearch概念

作者: 鲁智深 分类: java 发布时间: 2018-05-11 22:58

基本概念

1、集群:一个或者多个节点组织在一起,比如有3台服务器加在一起就是集群
2、节点:一个节点是集群中的一个服务器,由一个名字来标识,默认是一个一个随机的漫画角色的名字
3、分片:将索引划分为多份的能力,允许水平分割和扩展容量,多个分片响应请求,提高性能和吞吐量。
4、副本:创建分片的一份或者多份的能力,在一个节点失败其余节点可以顶上,比如我们某一个节点挂了,其他节点就能顶上。

在elasticsearch中index == mysql 数据库,type == 表,documents == 行,field == 列

elasticsearch是基于RESTful接口进行操作,所以需要去了解http请求方式GET,POST,PUT,DELETE,OPTIONS

倒排索引

一般情况下都是正排索引,我们通过关键词去搜索需要的文档在给到需要内容,当数据量非常大的时候,正排索引就会出现问题。那么我们用到倒排索引,倒排索引就是通过关键词去搜索单词,通过会匹配相关的文档内容。

简单记为:
正排索引:文档 —> 单词

倒排索引:单词 —> 文档

倒排索引

倒排索引

但是这样是不完善,了解seo的程序员就知道还会有一个权重的问题,比如关键词在文章中出现的次数,如果出现次数越多,那么此文章就权重越到,排名越靠前。

关键词权重

关键词权重

此为倒排索引最简单的原理,但类似谷歌,百度这类搜索引擎,其权重排序问题更加复杂。

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!

发表评论

电子邮件地址不会被公开。 必填项已用*标注