ValidateCsv 2025.5.31.15

捆绑包

org.apache.nifi | nifi-standard-nar

描述

根据用户指定的 CSV 架构验证 FlowFiles 的内容或 FlowFile 属性值。如需一些架构示例,请查看此处理器的附加文档。

标签

csv、schema、validation

输入要求

REQUIRED

支持敏感的动态属性

false

属性

属性

描述

CSV 源属性

包含待验证的 CSV 数据的属性名称。如果此属性为空,则会验证 FlowFile 内容。

validate-csv-delimiter

在传入数据中用作“分隔符”的字符。示例:,

validate-csv-eol

在传入数据中用作“行尾”的符号。示例:n

validate-csv-header

如果传入的 FlowFile 包含要忽略的标头,则为 true,否则为 false。

validate-csv-quote

在传入数据中用作“引号”的字符。示例:"

validate-csv-schema

用于验证的架构。应输入以逗号分隔的字符串,表示需要应用的单元格处理器架构定义中允许使用以下单元格处理器:[ParseBigDecimal、ParseBool、ParseChar、ParseDate、ParseDouble、ParseInt、ParseLong、Optional、DMinMax、Equals、ForbidSubStr、LMinMax、NotNull、Null、RequireHashCode、RequireSubStr、Strlen、StrMinMax、StrNotNullOrEmpty、StrRegEx、Unique、UniqueHashCode、IsIncludedIn]。注意:除非使用 Optional,否则不能嵌套单元格处理器。如果 Header 为 false,则架构为必需。

validate-csv-strategy

将输入文件路由到输出关系时应用的策略。

validate-csv-violations

如果为 ture,validation.error.message 属性将包括第一个无效行的所有违规的列表。请注意,将此属性设置为 true 会稍微降低性能,因为将会验证所有列。如果为 false,则一旦发现某列违反了指定的约束条件,立即判定该行无效,并且只有第一个无效行的这种违规信息会包含在 validation.error.message 属性中。

关系

名称

描述

invalid

将根据指定的架构判定为无效、或者无法识别任何架构或 CSV 标头的 FlowFiles 路由到此关系

valid

将成功通过架构验证的 FlowFiles 路由到此关系

写入属性

名称

描述

count.valid.lines

如果是逐行验证,则为从源数据中提取的有效行数

count.invalid.lines

如果是逐行验证,则为从源数据中提取的无效行数

count.total.lines

如果是逐行验证,则为源数据中的总行数

validation.error.message

对于路由到 invalid 的 FlowFile,显示第一个验证错误的消息

语言: 中文