SplitAvro 2025.5.31.15

捆绑包

org.apache.nifi | nifi-avro-nar

描述

根据配置的输出大小,将二进制编码的 Avro 数据文件拆分为较小的文件。输出策略决定较小的文件是 Avro 数据文件,还是 FlowFile 属性中包含元数据的 Avro 裸记录。输出将始终采用二进制编码。

标签

avro、split

输入要求

REQUIRED

支持敏感的动态属性

false

属性

属性

描述

输出大小

每个拆分文件要包含的 Avro 记录数。如果传入文件的记录数少于输出大小,或者记录总数未平均除以输出大小,则可能会得到记录较少的拆分文件。

输出策略

确定输出的格式。要么是 Avro 数据文件,要么是裸记录。裸记录输出仅适用于已经需要此类输出的系统,不应将其用于正常用途。

拆分策略

拆分传入数据文件的策略。记录策略将通过反序列化每条记录来读取传入的数据文件。

传输元数据

是否将元数据从父数据文件传输到子数据文件。如果输出策略为裸记录,则元数据将作为 FlowFile 属性存储,否则将存储在数据文件标头中。

关系

名称

描述

failure

如果 FlowFile 在处理过程中由于任何原因而失败(例如,FlowFile 不是有效的 Avro),将路由到此关系

original

拆分的原始 FlowFile。如果 FlowFile 处理失败,则不会向该关系发送任何内容

split

所有从原始 FlowFile 中拆分出来的新文件都将路由到此关系

写入属性

名称

描述

fragment.identifier

由同一个父 FlowFile 生成的所有拆分 FlowFiles 都将带有为此属性添加的随机生成的相同 UUID

fragment.index

表示从单个父 FlowFile 创建的拆分 FlowFiles 的顺序的递增编号

fragment.count

从父 FlowFile 生成的拆分 FlowFiles 数量

segment.original.filename

父 FlowFile 的文件名

语言: 中文