第九节 Elasticsearch 入门总结 & 测试

1、产品与使用场景

Elasticsearch是一个开源的分布式搜索与分析引擎，提供了近实时搜索和聚合两大功能
Elastic Stack包括Elasticsearch, Kibana, Logstash, Beats等一系列产品。
Elasticsearch是核心引擎，提供了海量数据存储，搜索和聚合的能力。Beats是轻量的数据采集器，Logstash用来做数据转换，Kibana则提供了丰富的可视化展现与分析的功能。
Elastic Stack主要被广泛使用于：搜索，日志管理，安全分析，指标分析，业务分析，应用性能监控等多个领域
Elastic Stack开源了X-Pack在内的相关代码。作为商业解决方案，X-Pack的部分功能需要收费。Elastic公司从6.8和7.1开始，Security功能也可以免费使用
相比关系型数据库，Elasticsearch提供了如模糊查询，搜索条件的算分第等关系型数据库所不擅长的功能，但是在事务性等方面，也不如关系型数据库来的强大。因此，在实际生产环境中，需要考虑具体业务要求，综合使用

一个Elasticsearch集群可以运行在单节点上，也支持运行在多个服务器上，实现数据和服务的水平扩展
从逻辑角度看，索引是一些具有相似结构的文档的集合
物理角度看，分片是一个Lucene的实例。分片存储了索引的具体数据，分片可以分布在不同的节点之上。副本分片除了提高数据的可靠性，还能一定程度提升集群查询的性能
Elasticsearch的文档可以是任意的JSON格式的数据
将文档写进Elasticseach的过程叫索引(indexing)
Elasticsearch提供了REST API和Transport API两种方式，建议使用REST API

除了CRUD操作外，Elasticsearch还提供了bulk, mget和mseach等操作。从性能的角度上说，建议使用，以提升性能。但是，单次操作的数据量不要过大，以免引发性能问题
每个索引都有一个Mapping定义。包含文档的字段及类型，字段的Analyzer的相关配置
Mapping可以被动态的创建，为了避免一些错误的类型推算或者满足你特定的需求，可以显示的定义Mapping
Mapping可以动态创建，也可以显示定义。你可以在Mapping中定制Analyzer
你可以为字段指定定制化的analyzer，也可以为查询字符串指定search_analyzer
Index Template可以定义Mapping和Settings，并自动的应用到新创建的索引之上，建议要合理的使用Index Template
Dynamic Template支持在具体的索引上指定规则，为新增加的字段指定相应的Mappings

1．错，需要用POST命令创建。

错，Update文档，使用Pos下，PUT只能用来做Index或者Create

对

默认情况下，会创建相应的索引，并且自己设置Mapping，当然，实际情况还是要看是否有合适的Index Template

_doc

精确值不会被Analyzer分词，全文本会

三部分: Character Filter + Tokenizer + Token Filter

Match中的terms之间是or的关系，Match Phrase的terms之间是and的关系并且term之间位置关系也影响搜索的结果

slop

直接报错

文档被索引，新的字段在_source中可见。但是该字段无法被搜索

错。字段类型修改，需要重新reindex

对。可以在Mapping中为index和search指定不同的analyizer

错。可以通过为text类型的字段指定Not Indexed，使其无法被搜索