EvaluateRagRetrieval 2025.5.31.15¶
捆绑包¶
com.snowflake.openflow.runtime | runtime-rag-evaluation-processors-nar
描述¶
计算使用 LLM 作为判断的 RAG 系统的检索指标(Precision@N、Recall@N、FScore@N、MAP@N、MRR)。对于每条记录,它使用“精度”和“查全率”提示来评估响应,并将指标作为属性添加到 FlowFile。
输入要求¶
REQUIRED
支持敏感的动态属性¶
false
属性¶
属性 |
描述 |
---|---|
上下文标识符记录路径 |
记录中的 RecordPath 上下文数组的 IDs。 |
上下文记录路径 |
记录中上下文数组的 RecordPath。 |
评估结果记录路径 |
用于写入评估结果的 RecordPath。 |
标准答案记录路径 |
记录中的标准答案字段的 RecordPath。 |
LLM 提供商服务 |
用于向 LLM 发送评估提示的提供商服务 |
问题记录路径 |
记录中问题字段的 RecordPath。 |
记录读取器 |
用于读取 FlowFile 的记录读取器。 |
记录写入器 |
用于写入结果的记录写入器。 |
关系¶
名称 |
描述 |
---|---|
failure |
无法处理的 FlowFiles 将路由到此关系 |
success |
成功处理的 FlowFiles 将路由到此关系 |
写入属性¶
名称 |
描述 |
---|---|
n |
每次查询检索到的文档的平均数量。 |
precision.at.n |
所有查询的平均精度为 N。 |
recall.at.n |
所有查询的平均查全率为 N。 |
fscore.at.n |
所有查询的平均 F 分数为 N。 |
mrr |
平均倒数排名。 |
retrieval.eval.failures |
无法计算评估值的记录数。 |
json.parse.failures |
遇到的 JSON 解析失败次数。 |