类别:

系统函数 (控制)

EXECUTE_AI_EVALUATION

启动 Cortex Agent 评估运行或获取其状态。

有关 Cortex Agent 评估的更多信息,请参阅 Cortex Agent 评估

另请参阅:

GET_AI_RECORD_TRACE (SNOWFLAKE.LOCAL)GET_AI_EVALUATION_DATA (SNOWFLAKE.LOCAL)GET_AI_OBSERVABILITY_LOGS (SNOWFLAKE.LOCAL)

语法

EXECUTE_AI_EVALUATION( <evaluation_job> , <run_parameters> , <config_file_path> )

实参

evaluation_job

以下值之一:

  • “START”:开始评估

  • “STATUS”:检索评估的状态

run_parameters

包含以下键的 SQL OBJECT 值:

  • run_name:选择使用 时默认使用的角色和仓库。要执行 evaluation_job 操作的运行的名称。

config_file_path

指向代理评估配置的暂存区文件路径。此路径不能是已签名的 URL。有关完整配置 YAML 规范,请参阅 代理评估 YAML 规范

返回

此函数的返回值取决于 evaluation_job

  • “START”返回单个字符串消息,指示 SQL 执行成功还是失败。

  • “STATUS”返回一个表,其中包含有关评估运行的当前状态的信息。

“STATUS”评估作业返回的表具有以下列:

名称

类型

描述

RUN_NAME

VARCHAR

评估运行的名称。

AGENT_NAME

VARCHAR

正在评估的代理的(非限定)名称。

AGENT_TYPE

VARCHAR

正在评估的代理的类型。

STATUS

VARCHAR

评估运行的当前状态。

STATUS_DETAILS

ARRAY

在此运行期间出现的错误消息数组。

STATUS 列中的值是以下之一:

运行状态

状态

描述

CREATED

运行已创建但尚未启动。

INVOCATION_IN_PROGRESS

运行调用正在生成输出和跟踪。

INVOCATION_COMPLETED

运行调用已完成,所有输出和跟踪均已创建。

INVOCATION_PARTIALLY_COMPLETED

由于应用程序调用和跟踪生成出现故障,运行调用已部分完成。

COMPUTATION_IN_PROGRESS

正在进行指标计算。

COMPLETED

指标计算已完成,并附有详细的输出和跟踪。

PARTIALLY_COMPLETED

由于指标计算期间出现故障,运行已部分完成。

CANCELLED

运行已取消。

访问控制要求

有关进行 Cortex Agent 评估的完整访问控制要求,请参阅 Cortex Agent 评估 – 访问控制要求

示例

以下示例使用来自 @eval_db.eval_schema.metrics/agent_evaluation_config.yaml 的代理评估配置启动名为 run-1 的运行:

CALL EXECUTE_AI_EVALUATION(
  'START',
  OBJECT_CONSTRUCT('run_name', 'run-1'),
  '@eval_db.eval_schema.metrics/agent_evaluation_config.yaml'
);

以下示例使用来自 @eval_db.eval_schema.metrics/agent_evaluation_config.yaml 的代理配置查询评估运行 run-1 的状态:

CALL EXECUTE_AI_EVALUATION(
  'STATUS',
  OBJECT_CONSTRUCT('run_name', 'run-1'),
  '@eval_db.eval_schema.metrics/agent_evaluation_config.yaml'
);