ValidateCsv 2025.5.31.15¶
捆绑包¶
org.apache.nifi | nifi-standard-nar
描述¶
根据用户指定的 CSV 架构验证 FlowFiles 的内容或 FlowFile 属性值。如需一些架构示例,请查看此处理器的附加文档。
输入要求¶
REQUIRED
支持敏感的动态属性¶
false
属性¶
属性 |
描述 |
---|---|
CSV 源属性 |
包含待验证的 CSV 数据的属性名称。如果此属性为空,则会验证 FlowFile 内容。 |
validate-csv-delimiter |
在传入数据中用作“分隔符”的字符。示例:, |
validate-csv-eol |
在传入数据中用作“行尾”的符号。示例:n |
validate-csv-header |
如果传入的 FlowFile 包含要忽略的标头,则为 true,否则为 false。 |
validate-csv-quote |
在传入数据中用作“引号”的字符。示例:" |
validate-csv-schema |
用于验证的架构。应输入以逗号分隔的字符串,表示需要应用的单元格处理器架构定义中允许使用以下单元格处理器:[ParseBigDecimal、ParseBool、ParseChar、ParseDate、ParseDouble、ParseInt、ParseLong、Optional、DMinMax、Equals、ForbidSubStr、LMinMax、NotNull、Null、RequireHashCode、RequireSubStr、Strlen、StrMinMax、StrNotNullOrEmpty、StrRegEx、Unique、UniqueHashCode、IsIncludedIn]。注意:除非使用 Optional,否则不能嵌套单元格处理器。如果 Header 为 false,则架构为必需。 |
validate-csv-strategy |
将输入文件路由到输出关系时应用的策略。 |
validate-csv-violations |
如果为 ture,validation.error.message 属性将包括第一个无效行的所有违规的列表。请注意,将此属性设置为 true 会稍微降低性能,因为将会验证所有列。如果为 false,则一旦发现某列违反了指定的约束条件,立即判定该行无效,并且只有第一个无效行的这种违规信息会包含在 validation.error.message 属性中。 |
关系¶
名称 |
描述 |
---|---|
invalid |
将根据指定的架构判定为无效、或者无法识别任何架构或 CSV 标头的 FlowFiles 路由到此关系 |
valid |
将成功通过架构验证的 FlowFiles 路由到此关系 |
写入属性¶
名称 |
描述 |
---|---|
count.valid.lines |
如果是逐行验证,则为从源数据中提取的有效行数 |
count.invalid.lines |
如果是逐行验证,则为从源数据中提取的无效行数 |
count.total.lines |
如果是逐行验证,则为源数据中的总行数 |
validation.error.message |
对于路由到 invalid 的 FlowFile,显示第一个验证错误的消息 |