EvaluateRagFaithfulness 2025.5.31.15

捆绑包

com.snowflake.openflow.runtime | runtime-rag-evaluation-processors-nar

描述

通过使用 LLM(例如 OpenAI 的 GPT)分析响应来评估在检索增强生成 (RAG) 系统中生成的答案的可信度。处理器通过忠诚度指标和详细分析丰富每条 FlowFile 记录。

标签

ai、evaluation、faithfulness、llm、nlp、openai、openflow、rag

输入要求

REQUIRED

支持敏感的动态属性

false

属性

属性

描述

上下文标识符记录路径

记录中的 RecordPath 上下文数组的 IDs。

上下文记录路径

记录中上下文数组的 RecordPath。

评估结果记录路径

用于写入评估结果的 RecordPath。

Generated Answer Record Path

记录中答案字段的路径

LLM 提供商服务

用于向 LLM 发送评估提示的提供商服务

问题记录路径

记录中问题字段的 RecordPath。

记录读取器

用于读取 FlowFile 的记录读取器。

记录写入器

用于写入结果的记录写入器。

关系

名称

描述

failure

无法处理的 FlowFiles 将路由到此关系

success

成功处理的 FlowFiles 将路由到此关系

写入属性

名称

描述

average.answer.faithfulness

根据所有记录计算的平均忠诚度分数。

json.parse.failures

遇到的 JSON 解析失败次数。

用例

使用此处理器来评估 LLM 生成的答案相较于提供的上下文的真实性。它提供了可用于监控和改善 RAG 系统性能的指标。

语言: 中文