标签云编辑

标签云视图是文本数据的一种可视化表示,通常用来可视化自由形式的文本。标签一般是单独的词,每个标签的重要程度通过字体大小或颜色来表示。

每个词的字体大小,是由 指标 聚合来决定的。下列聚合可用于这个图:

指标聚合:

Count
计数 聚合返回所选索引模式中元素的原始计数。
Average
该聚合返回数字字段的平均值 。从下拉菜单中选择一个字段。
Sum
总和 聚合返回数字字段的总和。从下拉菜单中选择一个字段。
Min
最小值 聚合返回数字字段的最小值。从下拉菜单中选择一个字段。
Max
最大值 聚合返回数字字段的最大值。从下拉菜单中选择一个字段。
Unique Count
基数 聚合返回字段中唯一值的数量。从下拉菜单中选择一个字段。
Standard Deviation
扩展统计 聚合返回数字字段中数据的标准偏差。从下拉菜单中选择一个字段。
Percentiles
百分数 聚合将数字字段中的值分成您指定的百分数区间。从下拉列表中选择一个字段,然后在 Percentiles 输入域中指定一个或多个范围。点击 X 删除百分数字段。点击 + Add 添加百分数字段。
Percentile Rank
百分位等级 聚合返回指定的数值字段中的值的百分位等级。从下拉菜单中选择一个数字字段,然后在 Values 输入域中指定一个或多个百分比等级值。点击 X 删除值字段。点击 + Add 添加值字段。

父级管道聚合:

对于每个父管道聚合,您必须定义用于计算聚合的指标。这可能是您现有的指标之一或新的指标。您也可以嵌套这些聚合(例如产生3阶导数)。

Derivative
导数 聚合计算特定指标的导数。
Cumulative Sum
累计总和 聚合计算父直方图中指定指标的累计总和。
Moving Average
移动平均值 聚合将动态移动数据窗口,生成该窗口数据的平均值。
Serial Diff
串行差分 是一种时间序列中的值在不同时间滞后或周期内从自身减去的技术。

兄弟管道聚合:

就像使用父级管道聚合一样,您需要提供一个用于计算同级聚合的指标。除此之外,还需要提供一个桶聚合,它将定义同级聚合将在其中运行的桶。

Average Bucket
桶平均值 计算同级聚合中指定指标的(中数)平均值
Sum Bucket
桶总和 计算同级聚合中指定指标值的总和
Min Bucket
桶最小值 计算同级聚合中指定指标的最小值
Max Bucket
桶最大值 计算同级聚合中指定指标的最大值

您可以通过单击 + Add Metrics 按钮来添加聚合。

Custom Label 输入域中输入字符串以更改显示标签。

聚合决定了需要从数据集中抽取哪些信息。

在选择一个桶聚合前,要勾选 Split Tags 选项。

可以为标签云视图指定下列桶聚合:

Terms
一个 terms 聚合支持显示给定字段的前面或后面的 n 个元素,并按数量或自定义指标排序。

点击 Advanced 链接可以显示该指标或桶聚合的更多自定义选项:

JSON Input
这是一个文本字段,支持增加特定的 JSON 格式属性合并到聚合定义中,见下述例子:
{ \"script\" : \"doc[\'grade\'].value * 1.2\" }

注意:在 Elasticsearch 1.4.3及以后的版本中,这个功能需要打开 动态 Groovy 脚本

选择 Options 标签来改变下列图形的方向:

Text Scale
可以选择 linear*、 *logsquare root 作为文本比例。可以使用对数比例来显示指数变化的数据,或者使用平方根比例来归一化显示包含自身波动很大的变量的数据集。
Orientation
支持选择在标签云中如何定位文本,可以选择下列选项之一:

单个、直角和多个。

Font Size
支持设置视图的最小和最大字体大小。