EXECUTE_AI_EVALUATION¶

启动 Cortex Agent 评估运行或获取其状态。

有关 Cortex Agent 评估的更多信息，请参阅 Cortex Agent 评估。

另请参阅：: SYSTEM$CREATE_EVALUATION_DATASET , GET_AI_RECORD_TRACE (SNOWFLAKE.LOCAL) , GET_AI_EVALUATION_DATA (SNOWFLAKE.LOCAL) , GET_AI_OBSERVABILITY_LOGS (SNOWFLAKE.LOCAL)

语法¶

EXECUTE_AI_EVALUATION( <evaluation_job> , <run_parameters> , <config_file_path> )

evaluation_job

以下值之一：

“START”：开始评估

“STATUS”：检索评估的状态

run_parameters

包含以下键的 SQL OBJECT 值：

run_name：选择使用时默认使用的角色和仓库。要执行 evaluation_job 操作的运行的名称。

config_file_path

指向代理评估配置的暂存区文件路径。此路径不能是已签名的 URL。有关完整配置 YAML 规范，请参阅代理评估 YAML 规范。

此函数的返回值取决于 evaluation_job：

“START”返回单个字符串消息，指示 SQL 执行成功还是失败。

“STATUS”返回一个表，其中包含有关评估运行的当前状态的信息。

“STATUS”评估作业返回的表具有以下列：


名称	类型	描述
RUN_NAME	VARCHAR	评估运行的名称。
AGENT_NAME	VARCHAR	正在评估的代理的（非限定）名称。
AGENT_TYPE	VARCHAR	正在评估的代理的类型。
STATUS	VARCHAR	评估运行的当前状态。
STATUS_DETAILS	ARRAY	An array of error messages that occurred during this run.

STATUS 列中的值是以下之一：

运行状态¶
状态	描述
CREATED	运行已创建但尚未启动。
INVOCATION_IN_PROGRESS	运行调用正在生成输出和跟踪。
INVOCATION_COMPLETED	运行调用已完成，所有输出和跟踪均已创建。
INVOCATION_PARTIALLY_COMPLETED	由于应用程序调用和跟踪生成出现故障，运行调用已部分完成。
COMPUTATION_IN_PROGRESS	正在进行指标计算。
COMPLETED	指标计算已完成，并附有详细的输出和跟踪。
PARTIALLY_COMPLETED	由于指标计算期间出现故障，运行已部分完成。
CANCELLED	运行已取消。

For the full access control requirements to conduct a Cortex Agent evaluation, see Cortex Agent evaluations -- Access control requirements.

以下示例使用来自 @eval_db.eval_schema.metrics/agent_evaluation_config.yaml 的代理评估配置启动名为 run-1 的运行：

CALL EXECUTE_AI_EVALUATION(
  'START',
  OBJECT_CONSTRUCT('run_name', 'run-1'),
  '@eval_db.eval_schema.metrics/agent_evaluation_config.yaml'
);

以下示例使用来自 @eval_db.eval_schema.metrics/agent_evaluation_config.yaml 的代理配置查询评估运行 run-1 的状态：

CALL EXECUTE_AI_EVALUATION(
  'STATUS',
  OBJECT_CONSTRUCT('run_name', 'run-1'),
  '@eval_db.eval_schema.metrics/agent_evaluation_config.yaml'
);