PutVectaraDocument 2025.5.31.15

捆绑包

com.snowflake.openflow.runtime | runtime-vectara-processors-nar

描述

生成 JSON 文档并将其上传到 Vectara 的上传端点。输入文本可以是 JSON 对象、JSON 数组或 JSONL 格式。

标签

ai、llm、openflow、rag、vectara

输入要求

支持敏感的动态属性

false

属性

属性

描述

语料库 ID

Vectara 语料库的标识符

文档属性

逗号分隔式 NiFi 属性字段列表,如果存在,则将包含在文档元数据中。

文档作者

文档的作者

文档创建时间

创建文档时的时间戳(以纪元秒为单位)

文档日期

文档的创建日期

文档描述

文档的描述

文档 ID

根据文档的源路径或文档内容的哈希值构造的文档的唯一标识符。

文档来源 URL

文档的来源 URL

文档标题

文档标题

索引输入格式

索引服务的输入格式。JSON 对象:直接将 FlowFile 内容作为 JSON 有效负载进行加载。JSON 行:为 JSON 的每行创建一个新部分。JSON 数组:将 FlowFile 内容作为 JSON 数组加载,并为 JSON 数组中的每个元素创建一个新部分。

部分自定义维度

逗号分隔式元数据字段列表,如果在元数据路径中存在,则将包含为一个部分的自定义维度。自定义维度的值必须是有效数字。

部分筛选器属性

逗号分隔式元数据字段列表,如果在元数据路径中存在,则将包含为一个部分元数据筛选器。

部分 ID 属性

用于设置部分 ID 的字段,如果在元数据路径中存在,则会填充该字段。

部分元数据属性

逗号分隔式元数据字段列表,如果在元数据路径中存在,则将包含在部分元数据中。

部分元数据 JSON 路径

元数据 JSON 对象的 JSON 路径表达式。JSON 对象需要包含元数据字段的列表。这些字段将包含在部分元数据中。

部分文本 JSON 路径

文本字段的 JSON 路径表达式。

部分标题属性

用于设置部分标题的字段,如果在元数据路径中存在,则会填充该字段。

Vectara 客户端

Vectara 客户端服务。

关系

名称

描述

failure

Vectara failure 关系

original

Original 关系

success

Vectara success 关系

涉及其他组件的用例

将 PDF 文件发布到 Vectara 语料库。

另请参阅

语言: 中文