- 类别:
表函数 (Cortex Agent)
GET_AI_EVALUATION_DATA (SNOWFLAKE.LOCAL)¶
检索 Cortex Agent 评估运行的评估数据。
调用此函数可检查评估运行的所有记录跟踪。有关 Cortex Agent 评估的更多信息,请参阅 Cortex Agent 评估。
- 另请参阅:
EXECUTE_AI_EVALUATION、GET_AI_RECORD_TRACE (SNOWFLAKE.LOCAL)、GET_AI_OBSERVABILITY_LOGS (SNOWFLAKE.LOCAL)
语法¶
实参¶
database包含代理的数据库的名称。
schema包含代理的架构的名称。
agent_name要检索其记录的代理名称。
agent_type字符串常量
CORTEX AGENT。此值不区分大小写。run_name要检索其完整评估数据的运行的名称。
返回¶
包含指定评估信息的表,其中包含以下列:
列 |
数据类型 |
描述 |
|---|---|---|
RECORD_ID |
VARCHAR |
Snowflake 为此评估记录分配的唯一标识符。 |
INPUT_ID |
VARCHAR |
Snowflake 为此评估输入分配的唯一标识符。 |
REQUEST_ID |
VARCHAR |
Snowflake 为此请求分配的唯一标识符。 |
TIMESTAMP |
TIMESTAMP_TZ |
请求发起的时间(以 UTC 为单位)。 |
DURATION_MS |
INT |
代理返回响应所花费的时间(以毫秒为单位)。 |
INPUT |
VARCHAR |
用作此评估记录输入的查询字符串。 |
OUTPUT |
VARCHAR |
Cortex Agent 为此评估记录返回的响应。 |
ERROR |
VARCHAR |
请求期间发生的任何错误的相关信息。 |
GROUND_TRUTH |
VARCHAR |
用于评估此记录 Cortex Agent 输出的真实基准信息。 |
METRIC_NAME |
VARCHAR |
为此记录评估的指标名称。 |
EVAL_AGG_SCORE |
NUMBER |
为此记录分配的评估分数。 |
METRIC_TYPE |
VARCHAR |
所评估指标的类型。对于内置指标,值为 |
METRIC_STATUS |
VARIANT |
一个映射,包含有关此记录的代理 HTTP 响应的信息,包含以下键:
|
METRIC_CALLS |
ARRAY |
一个 VARIANT 值数组,包含有关计算后指标的信息。数组中的每个条目包含该指标的判定标准、指标分数的说明以及元数据。每个条目的键包括:
|
TOTAL_INPUT_TOKENS |
INT |
用于处理输入查询的令牌总数。 |
TOTAL_OUTPUT_TOKENS |
INT |
Cortex Agent 生成的输出令牌总数。 |
LLM_CALL_COUNT |
INT |
统计代理或评估器调用任意 LLM 的次数。 |
访问控制要求¶
权限 |
对象 |
备注 |
|---|---|---|
CORTEX_USER |
数据库角色 |
|
USAGE |
Cortex Agent |
|
MONITOR |
Cortex Agent |
对架构中的对象进行操作至少需要父数据库的一项权限和父架构的一项权限。
有关创建具有指定权限集的自定义角色的说明,请参阅 创建自定义角色。
有关对 安全对象 执行 SQL 操作的相应角色和权限授予的一般信息,请参阅 访问控制概述。
有关 Cortex Agent 评估所需的完整访问控制权限,请参阅 Cortex Agent 评估 – 访问控制要求。
示例¶
以下示例显示了名为 run-1 的运行的完整评估详情,其中代理名为 evaluated_agent,存储在 eval_db.eval_schema 架构中: