系统数据指标函数

本主题是 Snowflake 提供给所有账户的系统数据指标函数 (DMFs) 的参考。

可以调用这些系统 DMFs 以立即开始衡量数据质量。

关于系统 DMFs

Snowflake 在共享 SNOWFLAKE 数据库 的 CORE 架构中提供系统 DMFs。系统 DMFs 由 Snowflake 维护;您不能更改任何系统 DMF 的名称或功能。

每个系统 DMF 可帮助您衡量不同的数据质量属性。您可以为一个表或视图分配多个系统 DMF,以便更全面地衡量数据质量,从而满足您的治理和合规性需求。

系统 DMFs

目前,Snowflake 支持使用以下系统 DMFs 衡量常见指标,而无需对其进行定义:

类别

系统 DMF

描述

准确性

BLANK_COUNT

确定一列中有多少空白值。

BLANK_PERCENT

确定一列中空白值所占的百分比。

NULL_COUNT

确定一列中存在多少个 NULL 值。

NULL_PERCENT

确定一列中 NULL 值所占的百分比。

新鲜度

FRESHNESS

基于时间戳列确定表数据的新鲜度。

DATA_METRIC_SCHEDULE_TIME

定义自定义新鲜度指标。

统计信息

AVG

确定一列的平均值。

MAX

确定一列的最大值。

MIN

确定一列的最小值。

STDDEV

确定一列的标准差值。

唯一性

ACCEPTED_VALUES

确定一列中的值是否与布尔表达式匹配。

DUPLICATE_COUNT

确定一列中重复值(包括 NULL 值)的数量。

UNIQUE_COUNT

确定一列中唯一的非 NULL 值的数量。

ROW_COUNT

确定表或视图中的记录数量。

访问控制要求

有关使用系统 DMFs 的访问控制要求的信息,请参阅 授予系统 DMFs 的 USAGE 权限

语言: 中文