类别:

数据指标函数

DUPLICATE_COUNT(系统数据指标函数)

返回具有重复项的列值的数量,包括 NULL 值。

This topic provides the syntax for calling the function directly. To learn how to associate the function with a table or view so it runs at regular intervals, see 关联 DMF 以自动执行数据质量检查.

语法

SNOWFLAKE.CORE.DUPLICATE_COUNT(<query>)
Copy

实参

query

指定一个 SQL 查询,该查询仅投射单个列。

允许的数据类型

query 投射的列必须具有以下数据类型之一:

  • DATE

  • FLOAT

  • NUMBER

  • TIMESTAMP_LTZ

  • TIMESTAMP_NTZ

  • TIMESTAMP_TZ

  • VARCHAR

返回

该函数返回一个数据类型为 NUMBER 的标量值。

示例

确定 SSN 列中重复的 US 社会保险号的数量:

SELECT SNOWFLAKE.CORE.DUPLICATE_COUNT(
  SELECT
    ssn
  FROM hr.tables.empl_info
);
Copy
+---------------------------------------------------------------------+
| SNOWFLAKE.CORE.DUPLICATE_COUNT(SELECT ssn FROM hr.tables.empl_info) |
+---------------------------------------------------------------------+
| 0                                                                   |
+---------------------------------------------------------------------+
语言: 中文