SnowflakeDetectDuplicate 2025.5.31.15

捆绑包

com.snowflake.openflow.runtime | runtime-snowflake-processors-nar

描述

检查 Snowflake 表中是否已经存在 FlowFile 的哈希值(作为 FlowFile 属性提供),如果找到,则将 FlowFile 路由到“duplicate”,如果未找到,则路由到“distinct”,或错误时路由到“failure”。

标签

database、detect、duplicates、hash、snowflake

输入要求

REQUIRED

支持敏感的动态属性

false

属性

属性

描述

内容哈希

保存预先计算的哈希的 FlowFile 属性名称。支持表达式语言。

文档来源标识符

指定文档源标识符(文档 ID)。支持表达式语言。

文档来源名称

指定文档源系统名称。支持表达式语言。

Snowflake 连接服务

提供与 Snowflake 的连接的 DBCPService。

Snowflake 表名称

存储文件哈希的 Snowflake 表名。必须先在 Snowflake 连接服务中配置数据库和架构。

关系

名称

描述

distinct

与现有文档不匹配的 FlowFiles 将路由到此处(插入新的哈希)。

duplicate

与现有文档(相同哈希)匹配的 FlowFiles 将路由到此处。

failure

在处理过程中遇到错误或异常的 FlowFiles 将路由到此处。

写入属性

名称

描述

snowflake.detect.duplicate

一个“true”或“false”属性,表示 FlowFile 是否检测到重复项。

语言: 中文