ExtractAvroMetadata 2025.5.31.15

捆绑包

org.apache.nifi | nifi-avro-nar

描述

从 Avro 数据文件的标头中提取元数据。

标签

avro、metadata、schema

输入要求

REQUIRED

支持敏感的动态属性

false

属性

属性

描述

计数项目

如果为 true,则会统计数据文件中的项目数量,并将该数量存储在 FlowFile 的属性“item.count”中。计数操作是通过读取数据块并获取每个块中的项目数完成的,从而避免了反序列化。被计数的是数据文件中的顶级项目。例如,对于记录类型的架构,项目将是各个记录,而对于数组类型的架构,项目将是数组(而不是每个数组中的条目数)。

指纹算法

用于生成架构指纹的算法。可用选项基于 Avro 推荐的指纹生成方法。

元数据键

以逗号分隔的键列表,表示要从 Avro 文件头中提取的键/值对。键名“avro.schema”可用于提取完整的 JSON 格式的架构,而“avro.codec”可用于提取编码器名称(若存在)。

关系

名称

描述

failure

如果 FlowFile 无法解析为 Avro 或者由于任何原因无法提取元数据,则会将其路由到此关系

success

提取元数据后,FlowFile 将路由到此关系。

写入属性

名称

描述

schema.type

架构的类型(即记录、枚举等)。

schema.name

当类型为记录、枚举或固定类型时则包含名称,否则包含原始类型的名称。

schema.fingerprint

指纹算法的结果为十六进制字符串。

item.count

数据文件中的项目总数,仅在 Count Items 设置为 true 时才写入。

语言: 中文