ScanContent 2025.5.31.15

捆绑包

org.apache.nifi | nifi-standard-nar

描述

扫描 FlowFiles 的内容,查找是否包含用户提供的字典中的术语。如果发现匹配项,则系统会将该术语的 UTF-8 编码版本作为“matching.term”属性添加到 FlowFile 中。

标签

aho-corasick、byte sequence、content、dictionary、find、scan、search

输入要求

REQUIRED

支持敏感的动态属性

false

属性

属性

描述

字典编码

指定字典的编码方式。若选择“text”,则字典术语为 UTF-8 编码、以换行符分隔的文本;若选择“binary”,则字典术语由一个 4 字节整数(表示术语长度)加上该术语内容构成。

字典文件

术语字典的文件名

关系

名称

描述

matched

与字典中至少一个术语匹配的 FlowFiles 将被路由到此关系

unmatched

与字典中任何术语都不匹配的 FlowFiles 将被路由到此关系

写入属性

名称

描述

matching.term

使 Processor 将 FlowFile 路由到“matched”关系的匹配术语;如果 FlowFile 被路由到“unmatched”关系,则不会添加此属性

语言: 中文