- 类别:
MODEL_MONITOR_DRIFT_METRIC¶
从 模型监视器 获取漂移指标。每个模型监视器监控一个机器学习模型。
- 另请参阅:
有关更多信息,请参阅 查询监控结果。
语法¶
MODEL_MONITOR_DRIFT_METRIC(
<model_monitor_name>, <drift_metric_name>, <column_name>
[ , <granularity> [ , <start_time> [ , <end_time> [ , <extra_args> ] ] ] ]
)
实参¶
必填:
model_monitor_name用于计算指标的模型监视器名称。
有效值:模型监视器名称字符串。它可以是一个简单或完全限定的名称。
drift_metric_name指标的名称。
有效值:
'JENSEN_SHANNON''DIFFERENCE_OF_MEANS''WASSERSTEIN''POPULATION_STABILITY_INDEX'
column_name用于计算漂移的列名称。
有效值:作为模型监视器中的特征列、预测列或实际列存在的任何字符串。
可选:
granularity正在查询的时间范围的粒度。默认值为
1 DAY。有效值:
'<num> DAY''<num> WEEK''<num> MONTH''<num> QUARTER''<num> YEAR''ALL'NULL
start_time用于计算指标的时间范围的起始点。默认值为当前时间前 60 天,每次调用该函数时都会计算。
有效值:时间戳表达式或
NULL。end_time用于计算指标的时间范围的终点。默认值是当前时间,每次调用该函数时都会计算。
有效值:时间戳表达式或
NULL。extra_argsAdditional arguments for segment-specific queries. This parameter is optional - if not provided, the query returns metrics for all data (non-segment query).
Valid values: A string in JSON format specifying segment column and value pairs:
'{"SEGMENTS": [{"column": "<segment_column_name>", "value": "<segment_value>"}]}'备注
Currently, segment queries support only 1 segment column:value pair per query. You cannot query multiple segments simultaneously in a single function call.
For more information about segments, see ML 可观测性:随时间推移监控模型行为.
返回¶
列 |
描述 |
示例值 |
|---|---|---|
|
时间范围开始的时间戳。 |
|
|
指定时间范围内的指标值。 |
|
|
用于计算指标的记录数。 |
|
|
从指标计算中排除的记录数。 |
|
|
用于计算指标的记录数。 |
|
|
从指标计算中排除的记录数。 |
|
|
已计算的漂移指标名称。 |
|
|
已为其计算漂移指标的列名称。 |
|
|
Name of the segment column for which the metric is computed (or NULL for non-segment queries). |
|
|
Segment value for which the metric is computed (or NULL for non-segment queries). |
|
使用说明¶
要计算漂移指标,模型监视器必须设置一个基线。
如果您执行以下操作,可能会遇到错误:
不设置模型监视器基线。
请求非数字特征的数值漂移指标。
使用模型监视器中不存在的漂移指标。
如果您为 column_name 和 model_monitor_name 指定的值区分大小写或包含特殊字符或空格,请将它们放在双引号里。您必须将双引号放在单引号内,例如 '"<model_monitor_name>"'。
如果这两个字段中未提供双引号,则假定 column_name 或 model_monitor_name 不区分大小写。
To minimize potential impact from schema changes, update your queries to explicitly select only the necessary columns instead of using a wildcard (*).
示例¶
以下示例获取 MY_MONITOR 在一天内均值漂移指标的差异:
SELECT * FROM TABLE(MODEL_MONITOR_DRIFT_METRIC(
'MY_MONITOR', 'DIFFERENCE_OF_MEANS', 'MODEL_PREDICTION', '1 DAY', TO_TIMESTAMP_TZ('2024-01-01'), TO_TIMESTAMP_TZ('2024-01-02'))
)
以下示例获取了过去 30 天 MY_MONITOR 的 Jensen-Shannon 漂移指标:
SELECT * FROM TABLE(MODEL_MONITOR_DRIFT_METRIC(
'MY_MONITOR', 'JENSEN_SHANNON', 'MODEL_PREDICTION', '1 DAY', DATEADD('DAY', -30, CURRENT_DATE()), CURRENT_DATE())
)