CEFReader

描述

解析 CEF(通用事件格式)事件,将每行作为记录返回。该读取器允许根据 FlowFile 中的第一个事件推断架构,或提供用于解释值的显式架构。

标签

cef、parser、reader、record

属性

下表列出了各项属性,其中带星号 (*) 的为必需属性。其他属性视为可选属性。该表还指出了所有默认值以及属性是否支持 NiFi 表达式语言。

显示名称

API 名称

默认值

允许值

描述

接受空扩展名 *

accept-empty-extensions

false

  • true

  • false

如果设置为 true,系统将接受空扩展名并将其关联到 null 值。

DateTime 区域设置 *

datetime-representation

en-US

区域设置的 IETF BCP 47 表示形式,在解析具有长或短月份名称的日期字段(例如 may <en-US> 与 mai. <fr-FR>)时使用。默认值通常安全。仅在解析 CEF 消息时遇到问题的情况下,才进行更改

推理策略 *

inference-strategy

custom-extensions-inferred

  • 仅限标头

  • 标头和扩展名

  • 使用自定义扩展名作为字符串

  • 使用推断的自定义扩展名

定义架构中应包含的字段集以及解释字段的方式。

无效字段

invalid-message-field

当 CEF 解析器无法解析 FlowFile 中的行时,使用此属性。如果已设置,系统会添加一条包含一个字段的记录,而不是直接让 FlowFile 处理失败。此记录包含一个字段,其名称由该属性指定,而值则为原始消息。

原始消息字段

raw-message-field

如果已设置,原始消息将使用属性值作为字段名称添加到记录中。这与“rawEvent”扩展字段不同!

架构访问策略 *

schema-access-strategy

infer-schema

  • 使用“架构名称”属性

  • 使用“架构文本”属性

  • 架构参考读取器

  • 推断架构

指定如何获取用于解读数据的架构。

架构分支

schema-branch

指定在“架构注册表”属性中查找架构时使用的分支名称。如果所选架构注册表不支持分支,则该值将被忽略。

架构推理缓存

schema-inference-cache

指定推断架构时使用的架构缓存。如果未填充,则每次都会对架构进行推断。但是,如果指定了缓存,则将首先查询缓存,如果可以找到适用的架构,则将使用它而不是对架构进行推断。

架构名称

schema-name

${schema.name}

指定要在架构注册表属性中查找的架构的名称。

架构参考读取器 *

schema-reference-reader

服务实现,负责读取 FlowFile 属性或内容以确定架构参考标识符

架构注册表

schema-registry

指定用于架构注册表的控制器服务

架构文本

schema-text

${avro.schema}

Avro 格式架构的文本

架构版本

schema-version

指定要在架构注册表中查找的架构版本。如果未指定,则将检索架构的最新版本。

状态管理

此组件不存储状态。

受限

此组件不受限制。

系统资源注意事项

此组件未指定系统资源注意事项。

语言: 中文