custom_classifier
!ADD_REGEX¶
- 另请参阅:
为自定义分类器添加类和正则表达式,同时可为列名指定正则表达式和注释。
语法¶
<custom_classifier>!ADD_REGEX(
'<semantic_category>' ,
'<privacy_category>' ,
'<value_regex>' ,
[ <column_name_regex> ] ,
[ <description> ] ,
[ <threshold> ]
)
实参¶
必填:
semantic_category
指定语义类别的标识符(名称)。
有关语义类别的详细信息,请参阅 系统标签和类别。
privacy_category
指定以下值之一:
'IDENTIFIER'
、'QUASI_IDENTIFIER'
或'SENSITIVE'
。有关隐私类别的详细信息,请参阅 系统标签和类别。
value_regex
指定正则表达式以匹配列中的值。
您可以通过调用 REGEXP_LIKE 函数来测试正则表达式的语法。
可选:
column_name_regex
指定与要分类的列名匹配的正则表达式。
description
为添加到实例的值指定注释。
threshold
指定评分规则的阈值。
可接受的范围是大于
0.0
且小于或等于1.0
。默认:
0.8
。
输出¶
返回状态消息,指示类别与自定义分类器的关联,格式为:classifier_name:category_name
。
访问控制要求¶
实例角色 |
对象 |
备注 |
---|---|---|
|
自定义分类实例。 |
调用此方法的账户角色必须在自定义分类器上被授予此实例角色。 默认情况下,用于创建实例的账户角色可以调用此方法。 |
要对架构中的任何对象执行操作,需要对父数据库和架构的 USAGE 权限。
有关创建具有指定权限集的自定义角色的说明,请参阅 创建自定义角色。
使用说明¶
多次调用此方法会得到与该实例相关的正则表达式数量的累加结果。
在单独的 SQL 语句中调用每个方法(无需方法链接)。
所有用于分类目的的正则表达式搜索都不区分大小写。
在向自定义分类实例添加正则表达式之前,测试正则表达式。例如,使用 [ NOT ] REGEXP 函数确保结果中仅返回与正则表达式匹配的值:
SELECT <col_to_classify> FROM <table_with_col_to_classify> WHERE <col_to_classify> REGEXP('<regex>');
有关详细信息,请参阅 字符串函数(正则表达式)。
示例¶
将类别和正则表达式添加到 medical_codes
实例中:
CALL medical_codes!ADD_REGEX(
'ICD_10_CODES',
'IDENTIFIER',
'[A-TV-Z][0-9][0-9AB]\.?[0-9A-TV-Z]{0,4}',
'ICD.*',
'Add a regex to identify ICD-10 medical codes in a column',
0.8
);
返回:
+---------------+
| ADD_REGEX |
+---------------+
| ICD_10_CODES |
+---------------+