custom_classifier!ADD_REGEX

另请参阅:

使用自定义分类器对敏感数据进行分类

为自定义分类器添加类和正则表达式,同时可为列名指定正则表达式和注释。

语法

<custom_classifier>!ADD_REGEX(
  '<semantic_category>' ,
  '<privacy_category>' ,
  '<value_regex>' ,
  [ <column_name_regex> ] ,
  [ <description> ] ,
  [ <threshold> ]
  )
Copy

实参

必填:

semantic_category

指定语义类别的标识符(名称)。

有关语义类别的详细信息,请参阅 系统标签和类别

privacy_category

指定以下值之一:'IDENTIFIER''QUASI_IDENTIFIER''SENSITIVE'

有关隐私类别的详细信息,请参阅 系统标签和类别

value_regex

指定正则表达式以匹配列中的值。

您可以通过调用 REGEXP_LIKE 函数来测试正则表达式的语法。

可选:

column_name_regex

指定与要分类的列名匹配的正则表达式。

description

为添加到实例的值指定注释。

threshold

指定评分规则的阈值。

可接受的范围是大于 0.0 且小于或等于 1.0

默认:0.8

输出

返回状态消息,指示类别与自定义分类器的关联,格式为:classifier_name:category_name

访问控制要求

用于执行此操作的 角色 必须至少具有以下 权限

实例角色

对象

备注

custom_classifier!PRIVACY_USER

自定义分类实例。

调用此方法的账户角色必须在自定义分类器上被授予此实例角色。

默认情况下,用于创建实例的账户角色可以调用此方法。

要对架构中的任何对象执行操作,需要对父数据库和架构的 USAGE 权限。

有关创建具有指定权限集的自定义角色的说明,请参阅 创建自定义角色

有关对 安全对象 执行 SQL 操作的相应角色和权限授予的一般信息,请参阅 访问控制概述

使用说明

  • 多次调用此方法会得到与该实例相关的正则表达式数量的累加结果。

  • 在单独的 SQL 语句中调用每个方法(无需方法链接)。

  • 所有用于分类目的的正则表达式搜索都不区分大小写。

  • 在向自定义分类实例添加正则表达式之前,测试正则表达式。例如,使用 [ NOT ] REGEXP 函数确保结果中仅返回与正则表达式匹配的值:

    SELECT <col_to_classify>
    FROM <table_with_col_to_classify>
    WHERE <col_to_classify> REGEXP('<regex>');
    
    Copy

    有关详细信息,请参阅 字符串函数(正则表达式)

示例

将类别和正则表达式添加到 medical_codes 实例中:

CALL medical_codes!ADD_REGEX(
  'ICD_10_CODES',
  'IDENTIFIER',
  '[A-TV-Z][0-9][0-9AB]\.?[0-9A-TV-Z]{0,4}',
  'ICD.*',
  'Add a regex to identify ICD-10 medical codes in a column',
  0.8
);
Copy

返回:

+---------------+
|   ADD_REGEX   |
+---------------+
| ICD_10_CODES  |
+---------------+
语言: 中文