UpsertPinecone 2025.5.31.15

捆绑包

com.snowflake.openflow.runtime | runtime-pinecone-nar

描述

将向量(包括元数据和可选文本)发布到 Pinecone 索引。

标签

chatbot、embeddings、genai、genai、generative ai、llm、metadata、openflow、pinecone、publish、text、upsert、vector

输入要求

REQUIRED

支持敏感的动态属性

false

属性

属性

描述

ID 记录路径

记录中 ID 字段的路径

最大批处理大小

如果 FlowFile 中的记录数很大,则创建对 Pinecone 的单个请求可能会消耗大量的 NiFi 堆空间。为了避免这种情况,“最大批处理大小”可以限制在单个请求中发送的记录数量。如果记录数超过此值,将向 Pinecone 发送多个请求。

元数据记录路径

记录中元数据字段的路径

Pinecone API 密钥

Pinecone 服务的 API 密钥

Pinecone 索引

要使用的 Pinecone 索引的名称

Pinecone 命名空间

要使用的 Pinecone 命名空间的名称

记录读取器

用于读取 FlowFile 的记录读取器

稀疏向量索引路径

如果要提供稀疏向量,则 RecordPath 指向要使用的稀疏数据的索引。

稀疏向量值路径

如果要提供稀疏向量,则 RecordPath 指向要使用的稀疏数据的值。

文本字段名称

元数据中用于存储与向量相关的文本的字段名称。

文本记录路径

记录中包含与向量相关联的文本的字段路径。如果指定,则在发布到 Pinecone 时,文本将插入到元数据中。如果未指定,则不会将文本发送到 Pinecone。

向量记录路径

记录中向量字段的路径

Web 客户端服务

用于与 Pinecone 通信的 Web 客户端服务

关系

名称

描述

failure

无法发送到 Pinecone 且预计重试不会成功的 FlowFiles 将路由到此关系

retry

无法发送到 Pinecone,但重试可能会有所帮助的 FlowFiles 将路由到此关系

success

成功发送到 Pinecone 的 FlowFiles 将路由到此关系

涉及其他组件的用例

使用 OpenAI 的嵌入模型,为原始文本数据创建嵌入,或为一个记录字段中存在的文本(例如 JSON)创建嵌入,并将向量发布到 Pinecone。

将文档的嵌入添加到 Pinecone 索引中,替换针对该文档已存在的所有嵌入。

另请参阅

语言: 中文