- 类别:
:doc:`/sql-reference/functions-system`(系统信息)
SYSTEM$GET_CLASSIFICATION_RESULT¶
返回指定对象的分类结果。
语法¶
SELECT SYSTEM$GET_CLASSIFICATION_RESULT( '<object_name>' )
实参¶
object_name
包含待分类列的表、外部表、视图或物化视图的名称。如果当前会话中未使用数据库和架构,则名称必须完全限定。
名称必须与数据库中存储的名称完全相同。如果名称包含特殊字符、大写字母或空格,则名称必须先用双引号括起来,然后再放在单引号内。
返回¶
返回以下格式的 JSON 对象。例如:
{
"classification_result": {
"col1_name": {
"alternates": [],
"recommendation": {
"confidence": "HIGH",
"coverage": 1,
"details": [
{
"coverage": 1,
"semantic_category": "US_PASSPORT"
}
],
"privacy_category": "IDENTIFIER",
"semantic_category": "PASSPORT"
},
"valid_value_ratio": 1
},
"col2_name": { ... },
...
}
}
其中:
alternates
指定除推荐标签之外要考虑的每个标签和值的信息。
recommendation
根据分类过程,将有关每个标签和值的信息指定为主要选择。
这些值可以同时显示在备用值和建议值中:
classifier_name
用于为分类列添加标签的自定义分类实例的完全限定名称。
仅在使用自定义分类实例作为要在列上设置的标签的来源时,才会显示此字段。
confidence
指定以下值之一:
HIGH
、MEDIUM
或LOW
。该值表示 Snowflake 根据列采样过程以及列数据与 Snowflake 数据分类方式的一致性而得出的相对置信度。coverage
指定与特定类别的规则匹配的采样单元格值的百分比。
details
指定表示 SEMANTIC_CATEGORY 标签的 地理标签值 的字段和值。
privacy_category
指定隐私类别标签值。
可能的值为
IDENTIFIER
、QUASI-IDENTIFIER
和SENSITIVE
。semantic_category
指定语义类别标签值。
valid_value_ratio
指定样本大小中有效值的比率。无效值包括 NULL、空字符串和字符数超过 256 个的字符串。
使用说明¶
使用 ALTER TABLE ...MODIFY COLUMN ...SET TAG 语句来更新标签值。
要从列中取消设置分类系统标签,请使用 ALTER TABLE ...MODIFY COLUMN ...UNSET TAG 语句从外部表的元数据中删除较旧的暂存文件。
示例¶
返回表的 Data Classification 结果:
SELECT SYSTEM$GET_CLASSIFICATION_RESULT('hr.tables.empl_info');