UpsertPinecone 2025.5.31.15¶
捆绑包¶
com.snowflake.openflow.runtime | runtime-pinecone-nar
描述¶
将向量(包括元数据和可选文本)发布到 Pinecone 索引。
输入要求¶
REQUIRED
支持敏感的动态属性¶
false
属性¶
属性 |
描述 |
---|---|
ID 记录路径 |
记录中 ID 字段的路径 |
最大批处理大小 |
如果 FlowFile 中的记录数很大,则创建对 Pinecone 的单个请求可能会消耗大量的 NiFi 堆空间。为了避免这种情况,“最大批处理大小”可以限制在单个请求中发送的记录数量。如果记录数超过此值,将向 Pinecone 发送多个请求。 |
元数据记录路径 |
记录中元数据字段的路径 |
Pinecone API 密钥 |
Pinecone 服务的 API 密钥 |
Pinecone 索引 |
要使用的 Pinecone 索引的名称 |
Pinecone 命名空间 |
要使用的 Pinecone 命名空间的名称 |
记录读取器 |
用于读取 FlowFile 的记录读取器 |
稀疏向量索引路径 |
如果要提供稀疏向量,则 RecordPath 指向要使用的稀疏数据的索引。 |
稀疏向量值路径 |
如果要提供稀疏向量,则 RecordPath 指向要使用的稀疏数据的值。 |
文本字段名称 |
元数据中用于存储与向量相关的文本的字段名称。 |
文本记录路径 |
记录中包含与向量相关联的文本的字段路径。如果指定,则在发布到 Pinecone 时,文本将插入到元数据中。如果未指定,则不会将文本发送到 Pinecone。 |
向量记录路径 |
记录中向量字段的路径 |
Web 客户端服务 |
用于与 Pinecone 通信的 Web 客户端服务 |
关系¶
名称 |
描述 |
---|---|
failure |
无法发送到 Pinecone 且预计重试不会成功的 FlowFiles 将路由到此关系 |
retry |
无法发送到 Pinecone,但重试可能会有所帮助的 FlowFiles 将路由到此关系 |
success |
成功发送到 Pinecone 的 FlowFiles 将路由到此关系 |
涉及其他组件的用例¶
使用 OpenAI 的嵌入模型,为原始文本数据创建嵌入,或为一个记录字段中存在的文本(例如 JSON)创建嵌入,并将向量发布到 Pinecone。 |
将文档的嵌入添加到 Pinecone 索引中,替换针对该文档已存在的所有嵌入。 |