ExtractAvroMetadata 2025.5.31.15¶
捆绑包¶
org.apache.nifi | nifi-avro-nar
描述¶
从 Avro 数据文件的标头中提取元数据。
输入要求¶
REQUIRED
支持敏感的动态属性¶
false
属性¶
属性 |
描述 |
---|---|
计数项目 |
如果为 true,则会统计数据文件中的项目数量,并将该数量存储在 FlowFile 的属性“item.count”中。计数操作是通过读取数据块并获取每个块中的项目数完成的,从而避免了反序列化。被计数的是数据文件中的顶级项目。例如,对于记录类型的架构,项目将是各个记录,而对于数组类型的架构,项目将是数组(而不是每个数组中的条目数)。 |
指纹算法 |
用于生成架构指纹的算法。可用选项基于 Avro 推荐的指纹生成方法。 |
元数据键 |
以逗号分隔的键列表,表示要从 Avro 文件头中提取的键/值对。键名“avro.schema”可用于提取完整的 JSON 格式的架构,而“avro.codec”可用于提取编码器名称(若存在)。 |
关系¶
名称 |
描述 |
---|---|
failure |
如果 FlowFile 无法解析为 Avro 或者由于任何原因无法提取元数据,则会将其路由到此关系 |
success |
提取元数据后,FlowFile 将路由到此关系。 |
写入属性¶
名称 |
描述 |
---|---|
schema.type |
架构的类型(即记录、枚举等)。 |
schema.name |
当类型为记录、枚举或固定类型时则包含名称,否则包含原始类型的名称。 |
schema.fingerprint |
指纹算法的结果为十六进制字符串。 |
item.count |
数据文件中的项目总数,仅在 Count Items 设置为 true 时才写入。 |