博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Elasticsearch 2.4 cardinality(distinct count) aggregation 返回结果不准确
阅读量:7274 次
发布时间:2019-06-29

本文共 679 字,大约阅读时间需要 2 分钟。

hot3.png

问题发现

测试人员遇到个问题, ES在查询的时候实际数量只有4条, 做去重计算的时候结果是5, 实际查询如下图: 输入图片说明

图中可以看出 doc_count: 4, dc_hostname:5 这就有点奇怪了,doc_count只有4, 去重之后的count怎么会是5

原因分析及解决方案

经过ES官方文档的检查, 问题出现在ES 2.4, ES对cardinality的计算是放在内存中的, 如果内存不够, 结果可能就不准确, 内存的控制是基于参数precision_threshold, 如果count大于该值, 返回结果就不准确, 大约是5%的误差, 如果count小于该值, 返回结果基于是接近准确

  • ES 2.4 参数说明 precision_threshold默认值是 聚合层数(aggregations)*分桶(buckets)数量, 最大值是40000

  • 参数调整 调整precision_threshold参数为3000

"aggregations": {	"dc_hostname": {		"cardinality": {			"field": "hostname",			"precision_threshold": 3000		}	}}
  • 查询结果
"buckets": [  {    "key": "AM项目监控",    "doc_count": 4,    "dc_hostname": {      "value": 4    }  }]

转载于:https://my.oschina.net/u/2392330/blog/1649683

你可能感兴趣的文章
js 中的基本类型,引用类型,基本包装类型
查看>>
Word强大插件Writage使用手册
查看>>
CentOS7下PHP7.2安装redis扩展
查看>>
聊聊FilterSecurityInterceptor
查看>>
让数据库变快的10个建议
查看>>
Spring Boot 揭秘与实战
查看>>
【327天】跃迁之路——程序员高效学习方法论探索系列(实验阶段85-2017.12.29)...
查看>>
Redux 源码解析系列 -- Redux的实现思想
查看>>
数人云实录|微服务企业级落地将会带来哪些转变?
查看>>
[译]Flask教程--静态文件
查看>>
Laravel 大将之 View 模块
查看>>
Microsoft Graph:连接每个应用都需要的基础数据
查看>>
研究人员发现GPU侧道攻击漏洞
查看>>
解读 2018之Go语言篇(上):为什么Go语言越来越热?
查看>>
webpack 2 实践系列(一) — 安装与入门
查看>>
力荐!这些工具可以帮你写出干净的代码
查看>>
Chuck Cobb谈敏捷组织中PMO的角色
查看>>
Microsoft开源Visual Studio Test
查看>>
微软宣布公开预览Dev Spaces for AKS
查看>>
微软Azure首席架构师John Gossman就微软加入Linux基金会一事答疑
查看>>