SnowflakeDetectDuplicate 2025.10.2.19

捆绑包

com.snowflake.openflow.runtime | runtime-snowflake-processors-nar

描述

Checks if a FlowFile 's hash (provided as a FlowFile attribute) is already in a Snowflake table, and routes the FlowFile to' duplicate 'if found,'distinct 'if not found, or' failure' on errors.

标签

database、detect、duplicates、hash、snowflake

输入要求

REQUIRED

支持敏感的动态属性

false

属性

属性

描述

内容哈希

保存预先计算的哈希的 FlowFile 属性名称。支持表达式语言。

文档来源标识符

指定文档源标识符(文档 ID)。支持表达式语言。

文档来源名称

指定文档源系统名称。支持表达式语言。

Snowflake 连接服务

提供与 Snowflake 的连接的 DBCPService。

Snowflake 表名称

The Snowflake table name that stores the file hashes. The table name is case-insensitive. Database and schema must be configured prior in the Snowflake Connection Service.

关系

名称

描述

distinct

与现有文档不匹配的 FlowFiles 将路由到此处(插入新的哈希)。

duplicate

与现有文档(相同哈希)匹配的 FlowFiles 将路由到此处。

failure

在处理过程中遇到错误或异常的 FlowFiles 将路由到此处。

写入属性

名称

描述

snowflake.detect.duplicate

一个“true”或“false”属性,表示 FlowFile 是否检测到重复项。

语言: 中文