聂鑫,历史上的今天,滴滴司机

admin 2019-03-15 阅读:291

1. 背景

Elasticsearch可广泛应用于日志分析、全文检索、结构化数据分析等多种场景,大幅度降低维护多套专用系统的成本,在开源社区非常受欢迎。然而Elasticsearch为满足多种晁艺伦不同的使用场景,底层组合使用了多种数据结构,部分数据结构对具体的用户使用场景可能是冗余的,从而导致默认情况下无法达到性强入能和成本最优化。 幸运的是,Elasticsearch提供非常灵活的模板配置能力,用户可以按需进行优化。多数情况下,用户结合使用场景进行优化后,Elasticsearch的性能都会有数倍的提升,成本也对应有倍数级别的下降。本文主要介绍不同日志使用场景下的调优经验。

2. 日志处理基本流程

日志处理的基本流程包含:日志采集 ->柯德来 数据清洗 ->范冰冰奶奶 存储 -> 可视化分析。Elastic Stack提供完整的日志解决方案,帮助用户完成对日志处理全链路的管理,推荐大家使用。每个流程的处理如下:

 • 日志采集:从业务所在的机器上,较实时的采集日志传递给下cg鲨游。常用开源组件如Beats、Logs泓宣尹南风tash、Fluentd等。

 • 数据清洗:利用正则解析等机制,完成日志从文本数据到结构化数据的转换。用户可使用Logstash 或 Elasticsearch Ingest模块等完成数据清洗。

 • 存储:使用Elasticsearch对数据进行持久存储,并提供全文搜索和分析能力。

 • 可视化分析:通过图形界面,完成对日志的搜索分析,常用的开源组件如Kibana、Grafana。

使用Elastic Stack处理日志的详细过程,用户可参考官方文章Getting started with the Elastic Stack,这里不展开介绍。

3. 日志场顾少别太狂景调优

对于Elasticsearch的通用调优,之前分享的文章Elasticsearch调优实践,详细介绍了Elasticsearch在性能、稳定性方面的调优经验。而对于日志场景,不同的场景使用方式黑糖群侠传全集优酷差别较大,这里主要介绍肖柯常见使用方式下,性能和成本的优化思路。

3.1 基础场景

对于多数简单日志使用场景,用户一般只要求存储原始日志,并提供按关键字搜索日志记录的能力。对于此类场景,用户可跳过数据清洗阶段,并参考如下方式进行优化:

 • 建议打开最优压缩,一般可降低40%存储。

 • 设置原始日志字段(message)为text,去除keyword类型子字段,提供全文搜索能力还珠之天然呆是个萌物,降低存储。

 • 关闭_all索引,前面韩国教师已通过message提供全文搜索能力。

 • 对于其他字符串字段,统一设置为keyword类型,避免默认情况下字符串字段同时存储守护香香公主text、keyword两种类型的数据。

 • 使用开源组件(如B聂鑫,历史上的今天,滴滴司机eats)上报数据时会包含较多辅助信息,用户可通过修改组奇门气数天机秘法件配置文件进行裁剪。

这样去除message的keyword子字段、_all等顾准neil冗余信息后,再加上最优压缩,可以保证数据相对精简。下面给出这类场景的常用模板,供用户参考:

3.2 精准搜索场景

对于部分用户,普通的全文检索并不能满足需求,希望精准搜索日志中的肖铁峰某部分,例如每条日志中包含程序运行时多个阶段的耗时数据,对具体一个阶段的耗时进行搜索就比较麻烦。对于此类场景,用户可基于基础场景,进行如下调整:

 • 清洗过程中,可仅解析出需要精准搜索的部分作为独立字段,用于精准搜索。

 • 对于精准搜索字推推棒优酷空间段,如果无排序/聚合需求,可以关闭doc_values;对于字符串,一般使用keyword,可按需考虑使用text。

下面给出这类场景的常用模板,供用户参考:

3.3 统计分析场景

对于某些场景,日志包含的主要是程序运行时输出的统计信息,用户通常会完全解析日志进行精确查询、统计分析,而是否保存原始日志关系不大。对于此类场景,用户可进行如下调整:

 • 清洗过程中,解析出所有需要的数据作为独立字段;原始日志非必要时,建议去除。

 • 如果有强需求保留原始日志,滴血战刀电视剧全集可以设置该字段enabled属性为false,只存储不索引。

 • 多数字段保持默认即可,会自动建立索引、打开doc_values,可用于查询、排序、聚合。

 • 对部分无排序/聚合需求、开销高的字段,综穿之空间修复者可以关闭doc_values。

下面给出这类场景的常用模板,供用户参考:

ES 5.1及之后的版本,支持关键字查询时自动选择目标字段,用户没有必要再使用原始日志字段提供不指定字段进1931女子天团行查询的能力。

4. 小结

日志的使用方式比较灵活,本文结合常见的客户使用方式,从整体上对性能、成本进行优化。用户也可结合自身业务场景,参考文章Elasticsearch调优实践进行更细致的优化。