PutVectaraDocument 2025.5.31.15¶
捆绑包¶
com.snowflake.openflow.runtime | runtime-vectara-processors-nar
描述¶
生成 JSON 文档并将其上传到 Vectara 的上传端点。输入文本可以是 JSON 对象、JSON 数组或 JSONL 格式。
输入要求¶
支持敏感的动态属性¶
false
属性¶
属性 |
描述 |
---|---|
语料库 ID |
Vectara 语料库的标识符 |
文档属性 |
逗号分隔式 NiFi 属性字段列表,如果存在,则将包含在文档元数据中。 |
文档作者 |
文档的作者 |
文档创建时间 |
创建文档时的时间戳(以纪元秒为单位) |
文档日期 |
文档的创建日期 |
文档描述 |
文档的描述 |
文档 ID |
根据文档的源路径或文档内容的哈希值构造的文档的唯一标识符。 |
文档来源 URL |
文档的来源 URL |
文档标题 |
文档标题 |
索引输入格式 |
索引服务的输入格式。JSON 对象:直接将 FlowFile 内容作为 JSON 有效负载进行加载。JSON 行:为 JSON 的每行创建一个新部分。JSON 数组:将 FlowFile 内容作为 JSON 数组加载,并为 JSON 数组中的每个元素创建一个新部分。 |
部分自定义维度 |
逗号分隔式元数据字段列表,如果在元数据路径中存在,则将包含为一个部分的自定义维度。自定义维度的值必须是有效数字。 |
部分筛选器属性 |
逗号分隔式元数据字段列表,如果在元数据路径中存在,则将包含为一个部分元数据筛选器。 |
部分 ID 属性 |
用于设置部分 ID 的字段,如果在元数据路径中存在,则会填充该字段。 |
部分元数据属性 |
逗号分隔式元数据字段列表,如果在元数据路径中存在,则将包含在部分元数据中。 |
部分元数据 JSON 路径 |
元数据 JSON 对象的 JSON 路径表达式。JSON 对象需要包含元数据字段的列表。这些字段将包含在部分元数据中。 |
部分文本 JSON 路径 |
文本字段的 JSON 路径表达式。 |
部分标题属性 |
用于设置部分标题的字段,如果在元数据路径中存在,则会填充该字段。 |
Vectara 客户端 |
Vectara 客户端服务。 |
关系¶
名称 |
描述 |
---|---|
failure |
Vectara failure 关系 |
original |
Original 关系 |
success |
Vectara success 关系 |
涉及其他组件的用例¶
将 PDF 文件发布到 Vectara 语料库。 |