所有处理器（按字母顺序排列）¶

本主题按字母顺序提供所有 Snowflake Openflow 处理器的列表。该列表包括：

每个处理器的名称

每个处理器的摘要

A¶

	处理器	描述
	AbortQueryJob	使用 Bulk API 2 在 Salesforce 中中止查询作业。
	AttributesToCSV	生成输入 FlowFile 属性的 CSV 表示形式。
	AttributesToJSON	生成输入 FlowFile 属性的 JSON 表示形式。

C¶

	处理器	描述
	CalculateRecordStats	计算记录集中的记录数，也可以计算每个类别的元素数量，其中类别由用户定义的属性定义。
	CaptureChangeMySQL	从 MySQL 数据库读取 CDC 事件。
	CaptureChangePostgreSQL	从 PostgreSQL 数据库读取 CDC 事件。
	CaptureChangeSqlServer	从 SQL 服务器数据库读取 CDC 事件。
	CaptureGoogleDriveChanges	捕获对 Shared Google Drive 所做的更改，并针对发生的每一次更改发出 FlowFile。
	CaptureMicrosoft365GroupsChanges	获取 Microsoft365 组的更改，并针对发生的每一项更改发出 FlowFile。
	CaptureSharepointChanges	从 Sharepoint 文档库中捕获变更，并对发生的每个变更发出 FlowFile。
	CheckMetaAdsReportReadiness	正在检查 Meta Ads 报告是否可供下载的处理器。
	ChunkRecordText	将文本进行分块处理，支持按分隔符和最大字符长度递归拆分。
	ChunkText	将文本进行分块处理，支持按分隔符和最大字符长度递归拆分。
	CompressContent	使用用户指定的压缩算法压缩对 FlowFiles 的内容进行压缩或解压，并相应地更新 mime。
	ConnectWebSocket	充当 WebSocket 客户端端点，与远程 WebSocket 服务器进行交互。
	ConsumeAMQP	通过 AMQP 0 使用来自 AMQP 代理的 AMQP 消息。
	ConsumeAzureEventHub	通过检查点接收来自 Microsoft Azure 事件中心的消息，以确保事件处理的一致性。
	ConsumeBoxEnterpriseEvents	使用来自 Box admin_logs_streaming 流类型的企业事件。
	ConsumeBoxEvents	使用来自 Box 的所有事件。
	ConsumeElasticsearch	一种处理器，它使用范围查询对字段重复运行分页查询，以使用来自 Elasticsearch 索引/查询的新文档。
	ConsumeGCPubSub	使用来自已配置的 Google Cloud PubSub 订阅的消息。
	ConsumeIMAP	通过 IMAP 协议使用来自电子邮件服务器的消息。
	ConsumeJMS	使用 BytesMessage、TextMessage、ObjectMessage、MapMessage 或 StreamMessage 类型的 JMS 消息，将其内容转换为 FlowFile，并将其转换为“success”关系。
	ConsumeKafka	使用来自 Apache Kafka Consumer API 的消息。
	ConsumeKafka	使用来自 Apache Kafka Consumer API 的消息。
	ConsumeKinesisStream	Reads data from the specified AWS Kinesis stream and outputs a FlowFile for every processed Record (raw) or a FlowFile for a batch of processed records if a Record Reader and Record Writer are configured.
	ConsumeMQTT	订阅主题并接收来自 MQTT 代理的消息
	ConsumePOP3	通过 POP3 协议使用来自电子邮件服务器的消息。
	ConsumeSlack	从已配置的一个或多个 Slack 通道中检索消息。
	ConsumeSlackConversation	从应用程序可用的 Slack 对话中检索消息。
	ConsumeSlackHistory	从应用程序可用的所有 Slack 通道中提取历史消息。
	ConsumeSnowflakeStream	从 Snowflake 流中提取数据并将其写入到 FlowFile。
	ConsumeTwitter	Streams 通过 Twitter 的流式传输 API v2 进行推文。
	ControlRate	控制数据传输到后续处理器的速率。
	ConvertCharacterSet	将 FlowFile 的内容从一个字符集转换到另一个字符集
	ConvertRecord	使用配置的记录读取器和记录写入控制器服务将记录从一种数据格式转换为另一种数据格式。
	ConvertToJournalSchema	将传入的数据库架构转换为 Snowflake CDC 日志表的相应架构。
	CopyAzureBlobStorage_v12	将 Azure Blob 存储中的 blob 从一个账户/容器复制到另一个账户/容器。
	CopyS3Object	将文件从一个桶和键复制到 AWS S3 中的另一个桶和键
	CountText	计算传入文本的各种指标。
	CreateAmazonAdsReport	为 Amazon Ads 连接器创建报告配置的处理器。
	CreateAzureOpenAiEmbeddings	使用 Azure OpenAI 为文本创建嵌入。
	CreateBoxFileMetadataInstance	使用指定模板并基于 FlowFile 内容中的值，为 Box 文件创建一个元数据实例。
	CreateBoxMetadataTemplate	使用 FlowFile 内容中的字段规范创建 Box 元数据模板。
	CreateCohereEmbeddings	使用 Cohere 为文本创建嵌入。
	CreateMetaAdsReport	为 Meta Ads 连接器创建报告配置的处理器。
	CreateOpenAiEmbeddings	使用 OpenAI 为文本创建嵌入。
	CreateSnowflakeEmbeddings	使用 Snowflake Cortex 大型语言模型函数创建向量嵌入
	CreateVertexAIEmbeddings	使用 VertexAI 为文本创建嵌入。
	CryptographicHashContent	使用给定算法计算 FlowFile 内容的加密哈希值，然后将其写入输出属性。

D¶

	处理器	描述
	DebugFlow	DebugFlow 处理器可以帮助测试和调试 FlowFile 框架：它允许在收到 FlowFile 时，或者在使用计时器或基于 cron 的调度的情况下收到计时器事件（无需 FlowFile）时，明确触发各种响应。
	DecryptContentAge	使用 age-encryption 解密内容。
	DecryptContentPGP	解密 OpenPGP 消息的内容。
	DeduplicateRecord	该处理器对记录集中的单个记录进行去重处理。
	DeleteAzureBlobStorage_v12	从 Azure Blob 存储中删除指定的 blob。
	DeleteAzureDataLakeStorage	从 Azure Data Lake Storage 中删除提供的文件
	DeleteBoxFileMetadataInstance	使用指定的模板键从 Box 文件中删除元数据实例
	DeleteByQueryElasticsearch	使用查询从 Elasticsearch 索引中删除。
	DeleteDBFSResource	删除 DBFS 文件和目录。
	DeleteDynamoDB	根据哈希和范围键从 DynamoDB 中删除文档。
	DeleteFile	从文件系统中删除文件。
	DeleteGCSObject	从 Google Cloud Bucket 中删除对象。
	DeleteGridFS	使用文件名或查询从 GridFS 中删除文件。
	DeleteMilvus	按 ID 从 Milvus 数据库的集合中删除向量。
	DeleteMongo	对 MongoDB 集合执行删除查询。
	DeletePinecone	从 Pinecone 索引中删除向量。
	DeleteQueryJob	使用 Bulk API 2 在 Salesforce 中删除查询作业。
	DeleteS3Object	从 Amazon S3 桶中删除文件。
	DeleteSFTP	删除 SFTP 服务器上驻留的文件。
	DeleteSQS	从 Amazon Simple Queuing Service Queue 中删除消息
	DeleteUnityCatalogResource	删除 Unity Catalog 文件或目录。
	DescribeDataShare	描述 Salesforce Data Cloud 中的指定数据共享元数据。
	DescribeSFDCObject	在 Salesforce 中描述指定的对象元数据。
	DetectDuplicate	为每个传入 FlowFile 缓存一个根据 FlowFile 属性计算得出的值，并确定缓存的值是否已经被看到。
	DistributeLoad	根据分布策略将 FlowFiles 分布到下游处理器。
	DuplicateFlowFile	此处理器用于负载测试，将为每个传入 FlowFile 的副本创建配置数量。

E¶

	处理器	描述
	EncodeContent	使用 Base64、Base32 或十六进制编码架构对 FlowFile 的内容进行编码或解码
	EncryptContentAge	使用 age-encryption 加密内容。
	EncryptContentPGP	使用 OpenPGP 加密内容。
	EnforceOrder	强制执行单个节点内属于同一数据组的 FlowFiles 预期排序。
	EnrichAttributes	使用配置的 Lookup Service 查找一个值，并将结果作为一个或多个属性添加到 FlowFile 中。
	EnrichCdcStream	丰富来自 CaptureChangePostgreSQL 等的传入 FlowFiles。
	EvaluateJsonPath	对照 FlowFile 的内容评估一个或多个 JsonPath 表达式。
	EvaluateRagAnswerCorrectness	通过计算 F1 分数、余弦相似度和答案正确性等指标，评估检索增强生成 (RAG) 上下文中生成的答案的正确性。
	EvaluateRagFaithfulness	通过使用 LLM 分析响应来评估在检索增强生成 (RAG) 系统中生成的答案的可信度（例如
	EvaluateRagRetrieval	计算使用 LLM 作为判断的 RAG 系统的检索指标（Precision@N、Recall@N、FScore@N、MAP@N、MRR）。
	EvaluateXPath	对照 FlowFile 的内容评估一个或多个 XPaths。
	EvaluateXQuery	对照 FlowFile 的内容评估一个或多个 XQueries。
	ExecuteGroovyScript	实验性扩展 Groovy 脚本处理器。
	ExecuteProcess	运行用户指定的操作系统命令并将该命令的输出写入 FlowFile。
	ExecuteScript	实验 – 在给定 FlowFile 和流程会话的情况下执行脚本。
	ExecuteSQL	执行提供的 SQL select 查询。
	ExecuteSQLRecord	执行提供的 SQL select 查询。
	ExecuteSQLStatement	对数据库执行 SQL DDL 或 DML 语句。
	ExecuteStreamCommand	ExecuteStreamCommand 处理器提供了一种灵活的方式，来将外部命令和脚本集成到 NiFi 数据流中。
	ExtractAvroMetadata	从 Avro 数据文件的标头中提取元数据。
	ExtractEmailAttachments	从 mime 格式的电子邮件文件中提取附件，将其拆分为单独的 FlowFile。
	ExtractEmailHeaders	Using the flowfile content as source of data, extract header from an RFC compliant email file adding the relevant attributes to the flowfile.
	ExtractGrok	对照 FlowFile 的内容评估一个或多个 Grok 表达式，将结果添加为属性或用匹配内容的 JSON 符号替换 FlowFile 的内容
	ExtractRecordSchema	使用提供的记录读取器从 FlowFile 中提取记录架构并将其写入到 'avro.
	ExtractSchemaColumns	使用提供的记录读取器从 FlowFile 中提取记录架构列，并将其写入 'schema.
	ExtractStructuredBoxFileMetadata	使用 Box AI 从 Box 文件中提取元数据。
	ExtractText	对照 FlowFile 的内容评估一个或多个正则表达式。

F¶

	处理器	描述
	FetchAzureBlobStorage_v12	从 Azure Blob 存储中检索指定的 blob 并将其内容写入到 FlowFile 的内容中。
	FetchAzureDataLakeStorage	从 Azure Data Lake Storage 中提取指定文件
	FetchBoxFile	从 Box 文件夹中提取文件。
	FetchBoxFileInfo	从 Box 中提取文件的元数据并将其添加到 FlowFile 的属性中。
	FetchBoxFileMetadataInstance	使用模板键和范围检索与 Box 文件关联的特定元数据实例。
	FetchBoxFileRepresentation	使用表示提示提取 Box 文件表示形式并将其写入 FlowFile 内容。
	FetchDatabaseMetadata	提取所有表的完整数据库元数据并将其输出到 FlowFile。
	FetchDistributedMapCache	从 FlowFile 属性中为每个传入的 FlowFile 计算缓存键，并从“Distributed Map Cache”中获取与每个键相关的值。
	FetchDropbox	从 Dropbox 提取文件。
	FetchFile	从磁盘读取文件的内容并将其流式传输到传入 FlowFile 的内容中。
	FetchFTP	从远程 FTP 服务器获取文件的内容，并使用远程文件的内容覆盖传入 FlowFile 的内容。
	FetchGCSObject	从 Google Cloud Bucket 中提取文件。
	FetchGoogleDrive	从 Google 云端硬盘文件夹中提取文件。
	FetchGoogleDriveFileComments	提取 Google Drive 文件的评论及其回复。
	FetchGoogleDriveMetadata	提取 Google 云端硬盘文件元数据。
	FetchGridFS	通过文件名或用户定义的查询从 GridFS 桶中检索一个或多个文件。
	FetchJiraFields	使用 REST API v3 /field 端点检索 Jira Cloud 实例中所有字段的完整元数据。
	FetchJiraIssues	使用带可配置搜索选项的 REST API v3 从 Jira Cloud 提取问题。
	FetchMicrosoftDataverseTable	从 Microsoft Dataverse 表中获取记录
	FetchS3Object	检索 S3 对象的内容并将其写入到 FlowFile 的内容中
	FetchSFTP	从远程 SFTP 服务器获取文件的内容，并使用远程文件的内容覆盖传入 FlowFile 的内容。
	FetchSharepointFile	从 Sharepoint Drive 提取文件内容，如果适用，可以选择下载文件的 PDF 或 HTML 版本。
	FetchSharepointMetadata	对于每个驱动器项目，都会检索其元数据和权限，并将其写入为 FlowFile 属性。
	FetchSlackConversationInfo	提取 Slack 对话信息和成员的电子邮件
	FetchSlackFile	下载在 Slack 上共享的文件。
	FetchSlackMessage	提取有关单条 Slack 消息的数据
	FetchSmb	从 SMB 共享中提取文件。
	FetchSnowflakeTableProperties	从表中读取属性并将其存储为 FlowFile 属性。
	FetchSourceTableSchema	提取表架构（即
	FetchTableSnapshot	从数据库中提取表的快照。
	FilterAttribute	通过保留指定属性并移除其余属性或移除指定属性并保留其余属性来筛选 FlowFile 的属性。
	FindConfluencePages	使用空间名称和页面名称查找 Confluence 页面的处理器。
	FindSharepointDriveItem	根据 Sharepoint Drive ID 和项目路径查找 Sharepoint Drive 项目。
	FlattenJson	使用户能够获取嵌套的 JSON 文档，并将其展平化为简单的键/值对文档。
	ForkEnrichment	该处理器与 JoinEnrichment 处理器配合使用，负责添加 JoinEnrichment 处理器执行其功能所需的属性。
	ForkRecord	该处理器允许用户将一条记录分成多条记录。

G¶

	处理器	描述
	GenerateAnswersFromContext	使用大型语言模型 (LLM) 生成传入记录中存在的每个问题的综合答案。
	GenerateAnswersFromGroundTruth	使用 LLM 生成传入记录中每个问题的综合答案。
	GenerateFlowFile	该处理器使用随机数据或自定义内容创建 FlowFiles。
	GenerateJSON	根据可配置的 JSON 架构生成一批具有随机字段值的 JSON 对象。
	GenerateRecord	此处理器使用指定字段具有随机值的记录创建 FlowFiles。
	GenerateTableFetch	生成从表中获取提取由行构成的“页”的 SQL select 查询。
	GeoEnrichIP	查找 IP 地址的地理位置信息，并将地理信息添加至 FlowFile 属性。
	GeoEnrichIPRecord	查找 IP 地址的地理位置信息，并将地理信息添加至 FlowFile 属性。
	GetAmazonAdsReport	在准备就绪时，处理器会从 Amazon Ads 下载报告。
	GetAwsPollyJobStatus	检索 AWS Polly 作业的当前状态。
	GetAwsTextractJobStatus	检索 AWS Textract 作业的当前状态。
	GetAwsTranscribeJobStatus	检索 AWS 转录作业的当前状态。
	GetAwsTranslateJobStatus	检索 AWS Translate 作业的当前状态。
	GetAzureEventHub	在不进行可靠的检查点跟踪的情况下接收来自 Microsoft Azure 事件中心的消息。
	GetAzureQueueStorage_v12	从 Azure Queue Storage 中检索消息。
	GetBoxFileCollaborators	检索 Box 文件中的所有协作者，并将协作信息添加到 FlowFile 的属性中。
	GetBoxGroupMembers	检索 Box 组的成员并将其详细信息写入 FlowFile 属性。
	GetConfluenceAuditRecords	处理器列表 Confluence 审计记录。
	GetConfluenceGroupUsers	下载属于特定 Confluence 组用户信息的处理器
	GetConfluencePageContent	Processor downloading Confluence pages.
	GetConfluencePageIds	下载自上次同步以来更改的 Confluence 页面，并将每个页面作为带元数据的 FlowFile 发出。
	GetConfluencePagePermissions	处理器下载 Confluence 页面权限。
	GetConfluenceSpaceIds	用于检索 Confluence 空间 ID 的处理器。
	GetConfluenceSpacePermissions	处理器下载 Confluence 空间权限。
	GetDataShareCredentials	描述 Salesforce Data Cloud 中的指定数据共享元数据。
	GetDataShareTables	描述 Salesforce Data Cloud 中的指定数据共享元数据。
	GetDBFSFile	读取 DBFS 文件。
	GetDynamoDB	根据哈希和范围键从 DynamoDB 中检索文档。
	GetElasticsearch	Elasticsearch get 处理器，它使用官方 Elastic REST 客户端库，通过 _id 从 Elasticsearch 提取单个文档。
	GetFile	从目录中的文件创建 FlowFiles。
	GetFileResource	该处理器使用配置的文件资源的内容创建 FlowFiles。
	GetFTP	从 FTP 服务器提取文件并从这些文件中创建 FlowFiles
	GetGcpVisionAnnotateFilesOperationStatus	检索 Google Vision 操作的当前状态。
	GetGcpVisionAnnotateImagesOperationStatus	检索 Google Vision 操作的当前状态。
	GetGoogleAdsReport	可以与 Google Ads Reporting API 进行交互的处理器。
	GetGoogleGroupMembers	从一个或多个 Google Groups 中检索成员，这些群组通过 FlowFile 属性中提供的逗号分隔的群组 IDs 列表指定。
	GetGoogleSheets	负责从 Google 表格中提取数据的处理器。
	GetHubSpot	从私有 HubSpot 应用程序检索 JSON 数据。
	GetHubSpotObject	按 ID 或唯一值获取 HubSpot 对象及其关联。
	GetHubSpotSchema	检索 HubSpot 对象类型的架构信息，包括字段名称、类型和标签。
	GetLinkedInAdsReport	处理器从 LinkedIn Reporting APIs 下载指标。
	GetMicrosoft365GroupMembers	检索 Microsoft365 组成员，并针对发生的每一项更改发出 FlowFile。
	GetMongo	从用户指定的查询加载的 FlowFiles 中的文档创建 MongoDB。
	GetMongoRecord	GetMongo 的基于记录的版本，使用记录写入器来写入 MongoDB 结果集。
	GetQueryJobResult	使用 Bulk API 2 在 Salesforce 中获取查询作业的结果。
	GetQueryJobStatus	使用 Bulk API 2 在 Salesforce 中获取查询作业的状态。
	GetS3ObjectMetadata	检查 S3 中是否存在某个对象并在不尝试下载的情况下提取其元数据。
	GetS3ObjectTags	检查 S3 中是否存在某个对象并在不尝试下载的情况下提取其标签。
	GetSFTP	从 SFTP 服务器提取文件并从这些文件中创建 FlowFiles
	GetSharepointSiteGroupMembers	检索 SharePoint 站点组的所有成员。
	GetShopify	从自定义 Shopify 商店检索对象。
	GetSmbFile	将文件从 samba 网络位置读取到 FlowFiles。
	GetSplunk	从 Splunk Enterprise 中检索数据。
	GetSQS	从 Amazon Simple Queuing Service Queue 中提取消息
	GetUnityCatalogFile	读取最大 5 GiB 的 Unity Catalog 文件。
	GetUnityCatalogFileMetadata	检查 Unity Catalog 文件元数据。
	GetWorkdayReport	该处理器可以与可配置的 Workday 报告进行交互。
	GetZendesk	逐步从 Zendesk API 提取数据。

H¶

	处理器	描述
	HandleHttpRequest	启动 HTTP 服务器并监听 HTTP 请求。
	HandleHttpResponse	向生成了 FlowFile 的请求者发送 HTTP 响应。

I¶

	处理器	描述
	IdentifyMimeType	尝试识别用于 FlowFile 的 MIME 类型。
	InvokeHTTP	可以与可配置的 HTTP 端点交互的 HTTP 客户端处理器。
	InvokeScriptedProcessor	实验性功能 – 为给定脚本中定义的处理器调用脚本引擎。
	ISPEnrichIP	查找 IP 地址的 ISP 信息，并将信息添加至 FlowFile 属性。

J¶

	处理器	描述
	JoinEnrichment	将两个不同 FlowFiles 中的记录合并，其中一个 FlowFile 作为“original”，包含任意记录，第二个 FlowFile 作为“enrichment”，包含应用于丰富第一个文件的附加数据。
	JoltTransformJSON	将 Jolt 规范列表应用于 FlowFile JSON 内容或指定 FlowFile JSON 属性。
	JoltTransformRecord	对 FlowFile 有效负载中的每条记录应用 JOLT 规范。
	JSLTTransformJSON	对 FlowFile JSON 有效负载应用 JSLT 转换。
	JsonQueryElasticsearch	一种允许用户运行使用 Elasticsearch JSON DSL 编写的查询（包含聚合）的处理器。

L¶

	处理器	描述
	ListArchivedHubSpotData	列出 HubSpot 中所选对象类型的存档数据，并为每个列出的对象生成一个 FlowFile，并将相应的元数据作为 FlowFile 属性。
	ListAzureBlobStorage_v12	列出 Azure Blob 存储容器中的 Blob。
	ListAzureDataLakeStorage	列出 Azure Data Lake Storage Gen 2 文件系统中的目录
	ListBoxFile	列出 Box 文件夹中的文件。
	ListBoxFileInfo	提取 Box 文件夹中每个文件的文件元数据。
	ListBoxFileMetadataInstances	检索与 Box 文件关联的所有元数据实例。
	ListBoxFileMetadataTemplates	检索与 Box 文件关联的所有元数据模板。
	ListConfluenceGroups	处理器列表 Confluence 群组。
	ListDatabaseTables	生成一组 FlowFile，每个文件都包含与数据库连接中表的元数据相对应的属性。
	ListDBFSDirectory	列出 DBFS 目录中的文件名并输出带有文件名的新 FlowFile。
	ListDropbox	从 Dropbox 检索文件列表（忽略快捷方式）。
	ListenFTP	启动一个 FTP 服务器，该服务器监听指定端口，并将传入文件转换为 FlowFiles。
	ListenHTTP	启动 HTTP 服务器并监听给定的基本路径以将传入的请求转换为 FlowFiles。
	ListenOTLP	通过 HTTP 或 gRPC 收集 OpenTelemetry 消息。
	ListenSlack	从一个或多个 Slack 对话中检索实时消息或 Slack 命令。
	ListenSyslog	监听通过 TCP 或 UDP 发送到给定端口的 Syslog 消息。
	ListenTCP	监听传入 TCP 连接并使用行分隔符作为消息分隔符从每个连接读取数据。
	ListenUDP	监听给定端口上的数据报包。
	ListenUDPRecord	在指定端口监听数据报包，并使用配置的记录读取器读取每个数据报的内容。
	ListenWebSocket	充当接受客户端连接的 WebSocket 服务器端点。
	ListFile	从输入目录检索文件列表。
	ListFTP	列出 FTP 服务器上驻留的文件。
	ListGCSBucket	从 GCS 桶中检索对象列表。
	ListGoogleDrive	列出 Google 云端硬盘文件夹中的具体文件（忽略快捷方式）。
	ListGoogleDriveFileInfo	列出指定 Google Drive 中的所有文件和文件夹。
	ListGoogleGroups	列出 Google Workspace 中给定域名的所有群组。
	ListHubSpotObjects	从 HubSpot 提取指定对象类型的数据，并为每个列出的对象生成一个 FlowFile，并将相应的元数据作为 FlowFile 属性。
	ListMicrosoftDataverseTables	列出来自 Microsoft Dataverse 环境的表
	ListS3	从 S3 桶中检索对象列表。
	ListSFDCDataShares	列出组织中可供已识别用户使用的可用数据共享。
	ListSFDCObjects	列出组织中可供识别用户使用的可用对象。
	ListSFTP	列出 SFTP 服务器上驻留的文件。
	ListSharepointDrives	为指定 Sharepoint 站点中存在的每个驱动器发出 FlowFile。
	ListSharepointSiteGroups	列出指定 SharePoint 站点上可用的所有 SharePoint 站点组。
	ListSmb	列出通过 SMB 协议共享的具体文件。
	ListTableNames	Fetches all source table names and matches them with one of the possible configurations: - regexp expression e.
	ListUnityCatalogDirectory	列出 Unity Catalog 目录中的文件名，并输出一个带有文件名的新 FlowFile。
	LogAttribute	在指定的日志级别发出 FlowFile 的属性
	LogMessage	在指定的日志级别发出日志消息
	LookupAttribute	从 Lookup Service 中查找属性
	LookupRecord	从记录中提取一个或多个字段，然后在 LookupService 中查找这些字段的值。

M¶

	处理器	描述
	MergeContent	根据用户定义的策略将一组 FlowFiles 合并在一起，并将它们打包成一个 FlowFile。
	MergeRecord	该处理器将多条面向记录的 FlowFiles 合并为一个 FlowFile，其中包含所有输入 FlowFiles 的记录。
	MergeSnowflakeJournalTable	在 Snowflake 中，针对从日记表到目标表的变更触发合并操作。
	ModifyBytes	丢弃二进制文件开头和结尾处的字节范围或所有内容。
	ModifyCompression	更改用于压缩 FlowFile 内容的压缩算法，方法是使用用户指定的压缩算法解压缩 FlowFiles 内容，然后使用指定的压缩格式属性重新压缩内容。
	MonitorActivity	监控流的活动情况：当在指定时间内未检测到任何数据流动时，发出一个指示信号；流活动恢复后，再次发出指示信号。
	MoveAzureDataLakeStorage	在 Azure Data Lake Storage Gen 2 中移动内容。

N¶

	处理器	描述
	通知	在分布式缓存中缓存版本信号标识符，也可以缓存 FlowFile 的属性。

O¶

	处理器	描述
	OpenAiTranscribeAudio	将音频转录为英文文本。

P¶

	处理器	描述
	PackageFlowFile	该处理器会将 FlowFile 属性和内容打包成可以从 NiFi 中导出和导回至 NiFi 的输出 FlowFile，同时保留原始属性和内容。
	PaginatedJsonQueryElasticsearch	一种允许用户运行使用 Elasticsearch JSON DSL 编写的分页查询（包含聚合）的处理器。
	ParseEvtx	解析 Windows 事件日志文件 (evtx) 的内容并将产生的 XML 写入 FlowFile
	ParseExcelCellReference	负责解析 Excel 单元格引用公式的处理器。
	ParseSyslog	尝试按照 RFC5424 和 RFC3164 格式解析 Syslog 消息的内容，并为 Syslog 消息的每个部分 FlowFile 添加属性。
	ParseSyslog5424	尝试按照 RFC5424 格式解析格式正确的 Syslog 消息的内容，并为 Syslog 消息的每个部分 FlowFile 添加属性，包括结构化数据。
	PartitionRecord	根据数据中配置的字段对面向记录的数据进行拆分或分区。
	PerformSnowflakeCortexOCR	使用 Snowflake Cortex ML 函数对 PDF 文档执行光学字符识别 (OCR)。
	PickTablesForReplication	Accepts a list of fully qualified table names and determines if a table: - is new (is not replicated, but was added in the source) - is existing (is replicated and exists in the source) - is stale (is replicated but no longer exists in the source) Configuration is passed as a FlowFile attribute.
	PromptAnthropicAI	向 Anthropic 发送提示，将响应作为 FlowFile 属性写入，或将其写入到传入 FlowFile 的内容中。
	PromptAzureOpenAI	向 Azure 的 OpenAI 服务发送提示，将响应写入为 FlowFile 属性或写入传入 FlowFile 的内容。
	PromptLLM	该处理器向大型语言模型 (LLM) 发送用户定义的提示以进行响应。
	PromptOpenAI	向 OpenAI 发送提示，将响应作为 FlowFile 属性写入或写入传入 FlowFile 的内容。
	PromptSnowflakeCortex	向 Snowflake Cortex 发送提示，将响应作为 FlowFile 属性写入或将其写入传入 FlowFile 中。
	PromptVertexAI	向 VertexAI 发送提示，将响应作为 FlowFile 属性写入或写入传入 FlowFile 的内容。
	PublishAMQP	根据 FlowFile 的内容创建 AMQP 消息，并将该消息发送到 AMQP 交换器。
	PublishGCPubSub	将传入 FlowFile 的内容发布到已配置的 Google Cloud PubSub 主题。
	PublishJMS	从 FlowFile 的内容创建 JMS 消息，并将其作为 JMS BytesMessage 或 TextMessage 发送到 JMS 目标（队列或主题）。
	PublishKafka	使用 Kafka Prod API 将 FlowFile 内容作为消息或单个记录发送给 Apache Kafka。
	PublishKafka	使用 Kafka Prod API 将 FlowFile 内容作为消息或单个记录发送给 Apache Kafka。
	PublishMQTT	向 MQTT 主题发布消息
	PublishSlack	向指定的 Slack 通道发布消息。
	PutAzureBlobStorage_v12	将内容放入 Azure Blob 存储的 blob 中。
	PutAzureCosmosDBRecord	该处理器是记录感知处理器，用于通过 Core SQL API 将数据插入 Cosmos DB。
	PutAzureDataExplorer	充当 Azure 数据资源管理器接收器，将 FlowFiles 发送到提供的端点。
	PutAzureDataLakeStorage	将 FlowFile 内容作为文件写入 Azure Data Lake Storage Gen 2
	PutAzureEventHub	将 FlowFile 内容发送到 Azure 事件中心
	PutAzureQueueStorage_v12	将传入 FlowFiles 写入已配置的 Azure Queue Storage。
	PutBigQuery	将 FlowFile 的内容写入 Google BigQuery 表中。
	PutBoxFile	将内容放入 Box 文件夹。
	PutCloudWatchMetric	向 Amazon CloudWatch 发布指标。
	PutDatabaseRecord	PutDatabaseRecord 处理器使用指定 RecordReader 从传入 FlowFile 中输入（可能是多条）记录。
	PutDatabricksSQL	使用 Databricks REST API 提交一条 SQL 执行请求，并将返回的 JSON 响应写入 FlowFile 内容中。
	PutDBFSFile	将 FlowFile 内容写入 DBFS。
	PutDistributedMapCache	使用根据 FlowFile 属性计算的缓存键，获取 FlowFile 的内容并将其放入分布式映射缓存中。
	PutDropbox	将内容放入 Dropbox 文件夹。
	PutDynamoDB	根据哈希和范围键从 DynamoDB 放置文档。
	PutDynamoDBRecord	根据以记录为导向的数据将项目插入 DynamoDB。
	PutElasticsearchJson	使用官方 Elastic REST 客户端库的 Elasticsearch 放置处理器。
	PutElasticsearchRecord	使用官方 Elastic REST 客户端库的记录感知 Elasticsearch put 处理器。
	PutEmail	对于每个传入的 FlowFile，向已配置的收件人发送一封电子邮件
	PutFile	将 FlowFile 的内容写入本地文件系统
	PutFTP	将 FlowFiles 发送到 FTP 服务器
	PutGCSObject	将 FlowFile 的内容作为对象写入到 Google Cloud Storage 中。
	PutGoogleDrive	将 FlowFile 的内容作为文件写入 Google Drive。
	PutGridFS	将文件写入 GridFS 桶。
	PutHubSpot	对一个 HubSpot 对象执行更新插入。
	PutIcebergTable	使用可配置的目录将记录存储在 Iceberg 中，以管理命名空间和表。
	PutKinesisFirehose	将内容发送到指定的 Amazon Kinesis Firehose。
	PutKinesisStream	将内容发送到指定的 Amazon Kinesis。
	PutLambda	将内容发送到指定的 Amazon Lambda 函数。
	PutMongo	将 FlowFile 的内容写入 MongoDB
	PutMongoBulkOperations	将 FlowFile 的内容作为批量更新写入 MongoDB
	PutMongoRecord	该处理器是记录感知处理器，用于向 MongoDB 中插入/更新数据。
	PutRecord	PutRecord 处理器使用指定的 RecordReader 从传入 FlowFile 中输入（可能包含多条）记录，并将其发送到 Record Destination Service（即记录接收器）指定的目标位置（即
	PutRedisHashRecord	使用指定的哈希值将记录字段数据放入 Redis，该哈希值由包含哈希值的每个记录中的字段的 RecordPath 确定。
	PutS3Object	将 FlowFile 的内容作为 S3 对象写入 Amazon S3 桶中。
	PutSalesforceObject	为指定的 Salesforce sObject 创建新记录。
	PutSFTP	将 FlowFiles 发送到 SFTP 服务器
	PutSmbFile	将 FlowFile 的内容写入 samba 网络位置。
	PutSnowflakeInternalStageFile	将文件放入 Snowflake 内部暂存区。
	PutSnowpipeStreaming	将记录流式传输到 Snowflake 表中。
	PutSnowpipeStreaming2	使用 Snowpipe Streaming 版本 2，将格式为换行分隔 JSON 的记录发送到 Snowflake 数据库管道。
	PutSNS	将 FlowFile 的内容作为通知发送到 Amazon Simple Notification Service
	PutSplunk	通过 TCP、TCP + TLS/SSL 或 UDP 将日志发送到 Splunk Enterprise。
	PutSplunkHTTP	通过 HTTP 或 HTTPS 将 FlowFile 内容发送到指定的 Splunk 服务器。
	PutSQL	执行 SQL UPDATE 或 INSERT 命令。
	PutSQS	向 Amazon Simple Queuing Service Queue 发布消息
	PutSyslog	通过 TCP 或 UDP 向给定的主机和端口发送 Syslog 消息。
	PutTCP	通过 TCP 将序列化的 FlowFiles 或记录发送到具有可选 TLS 支持的可配置目标
	PutUDP	PutUDP 处理器接收 FlowFile，并将 FlowFile 内容打包成单个 UDP 数据报包，然后将其传输到已配置的 UDP 服务器。
	PutUnityCatalogFile	将最大大小为 5 GiB 的 FlowFile 内容写入 Unity Catalog。
	PutVectaraDocument	生成 JSON 文档并将其上传到 Vectara 的上传端点。
	PutVectaraFile	将 FlowFile 内容上传到 Vectara 的索引端点。
	PutWebSocket	使用由 ListenWebSocket 或 ConnectWebSocket 建立的 WebSocket 会话向 WebSocket 远程端点发送消息。
	PutZendeskTicket	使用 Zendesk API 创建 Zendesk 票证。

Q¶

	处理器	描述
	QueryAzureDataExplorer	查询 Azure Data Explorer 并将 JSON 结果流式传输到输出 FlowFiles
	QueryDatabaseTable	生成 SQL select 查询，或使用提供的语句，然后执行该查询以获取指定最大值列中值大于先前看到的最大值的所有行。
	QueryDatabaseTableRecord	生成 SQL select 查询，或使用提供的语句，然后执行该查询以获取指定最大值列中值大于先前看到的最大值的所有行。
	QueryMilvus	使用向量查询 Milvus 数据库中的给定集合。
	QueryPinecone	查询 Pinecone 中与输入向量相似的向量，或根据 ID 检索指定向量。
	QueryRecord	对 FlowFile 内容执行一个或多个 SQL 查询。
	QuerySalesforceObject	从 Salesforce sObject 检索记录。
	QuerySplunkIndexingStatus	查询 Splunk 服务器以获取索引确认的状态。

R¶

	处理器	描述
	RemoveRecordField	修改包含面向记录的数据的 FlowFile 的内容（即
	RenameRecordField	重命名 FlowFile 的每条记录中的一个或多个字段。
	ReplaceText	通过在 FlowFile 内容中搜索某些文本值（通过正则表达式/regex 或字面量值）并将内容中匹配的部分替换为某个替代值来更新 FlowFile 的内容。
	ReplaceTextWithMapping	使用正则表达式匹配 FlowFile 内容，并将匹配部分替换为映射文件中提供的值，从而更新其内容。
	RetryFlowFile	FlowFiles 传递给此处理器时，会根据配置的“Maximum Retries”值检查“Retry Attribute”值。
	RouteOnAttribute	使用属性表达式语言基于其属性路由 FlowFiles
	RouteOnContent	将正则表达式应用于 FlowFile 的内容，并将 FlowFile 的副本路由到与正则表达式匹配的每个目的地。
	RouteText	根据用户定义的一组规则路由文本数据。
	RunDatabricksJob	触发预定义的 Databricks 作业，以使用自定义参数运行。
	RunMongoAggregation	每当收到 FlowFile 时运行聚合查询的处理器。

S¶

	处理器	描述
	SampleRecord	根据指定的抽样策略（例如蓄水池抽样算法），对 FlowFile 的记录进行抽样。
	ScanAttribute	扫描 FlowFiles 的指定属性，检查其值是否存在于指定的术语字典中
	ScanContent	扫描 FlowFiles 的内容，查找是否包含用户提供的字典中的术语。
	ScriptedFilterRecord	该处理器能够使用用户提供的脚本筛选掉 FlowFiles 的记录。
	ScriptedPartitionRecord	接收面向记录的数据（即
	ScriptedTransformRecord	提供对传入 FlowFile 中的每条记录评估一段简单脚本的功能。
	ScriptedValidateRecord	该处理器能够使用用户提供的脚本验证 FlowFiles 中的记录。
	SearchElasticsearch	一种允许用户重复运行使用 Elasticsearch JSON DSL 编写的分页查询（包含聚合）的处理器。
	SegmentContent	将 FlowFile 按字节边界拆分成多个较小的分段。
	SignContentPGP	使用 OpenPGP 私钥对内容进行签名
	SnowflakeDetectDuplicate	Checks if a FlowFile 's hash (provided as a FlowFile attribute) is already in a Snowflake table, and routes the FlowFile to' duplicate 'if found,'distinct 'if not found, or' failure' on errors.
	SplitAvro	根据配置的输出大小，将二进制编码的 Avro 数据文件拆分为较小的文件。
	SplitContent	按指定字节序列拆分传入的 FlowFiles
	SplitExcel	此处理器可将包含多个工作表的 Microsoft Excel 表格拆分为多个单独的 Excel 文件，其中原始文件中的每个工作表都会被转换为一个独立的电子表格，并各自成为一个 FlowFile。
	SplitJson	针对由 JsonPath 表达式指定的数组元素，将 JSON 文件分割成多个独立的 FlowFiles。
	SplitRecord	将面向记录的数据格式的输入 FlowFile 拆分成多个较小的 FlowFiles
	SplitText	在受最大行数或片段总大小的限制的行边界上，将文本文件拆分为多个较小的文本文件。
	SplitXml	将 XML 文件拆分成多个单独的 FlowFiles，其中每个都包含原始根元素的子元素或后代元素
	StartAwsPollyJob	触发 AWS Polly 作业。
	StartAwsTextractJob	触发 AWS Textract 作业。
	StartAwsTranscribeJob	触发 AWS 转录作业。
	StartAwsTranslateJob	触发 AWS Translate 作业。
	StartGcpVisionAnnotateFilesOperation	在文件输入时触发 Vision 操作。
	StartGcpVisionAnnotateImagesOperation	在图像输入时触发 Vision 操作。
	SubmitQueryJob	使用 Bulk API 2.0 向 Salesforce 提交查询作业。
	SummarizeText	该处理器使用大语言模型 (LLM) 来汇总 FlowFile 的内容。

T¶

	处理器	描述
	TagS3Object	在 Amazon S3 对象上添加或更新标签。
	TailFile	“跟踪”一个文件或文件列表，原样引入已写入文件的数据。
	TransformXml	将提供的 XSLT 文件应用于 FlowFile XML 有效负载。

U¶

	处理器	描述
	UnpackContent	解压缩使用几种不同打包格式之一打包的 FlowFiles 的内容，为每个输入 FlowFile 发出一个到多个 FlowFiles。
	UpdateAttribute	使用属性表达式语言更新一个 FlowFile 的属性和/或根据正则表达式删除属性
	UpdateBoxFileMetadataInstance	使用给定 FlowFile 中的记录更新 Box 文件的元数据模板值。
	UpdateBulkJobState	Updates the status of a Salesforce Bulk Job in the shared state service for a specific object type
	UpdateByQueryElasticsearch	使用查询更新 Elasticsearch 索引中的文档。
	UpdateCounter	该处理器允许用户在流中设置特定的计数器和关键点。
	UpdateDatabaseTable	该处理器使用 JDBC 连接和传入记录来生成支持传入记录所需的任何数据库表更改。
	UpdateRecord	更新包含面向记录的数据的 FlowFile 的内容（即
	UpdateSnowflakeDatabase	根据传入 FlowFile 中提供的架构更新 Snowflake 表的定义。
	UpdateSnowflakeIcebergDatabase	更新 Snowflake Iceberg 表的定义。
	UpdateSnowflakeSchema	如果不存在，则创建 Snowflake 数据库架构。
	UpdateSnowflakeStream	通过创建、删除或替换 Snowflake 流来管理它们，操作基于配置的操作类型。
	UpdateSnowflakeTable	根据传入 FlowFile 中提供的架构更新 Snowflake 表的定义。
	UpdateSnowflakeView	Creates or replaces Snowflake views based on column mappings provided in the incoming FlowFile.
	UpdateTableState	更新表状态服务中表的状态
	UpsertMilvus	将给定集合的向量更新插入到 Milvus 数据库中
	UpsertPinecone	将向量（包括元数据和可选文本）发布到 Pinecone 索引。
	UpsertSFDCObjects	将传入 FlowFile 中的记录更新插入到 Salesforce 中

V¶

	处理器	描述
	ValidateCsv	根据用户指定的 CSV 架构验证 FlowFiles 的内容或 FlowFile 属性值。
	ValidateJson	验证 FlowFiles 内容是否符合可配置的 JSON 架构。
	ValidateRecord	根据给定架构验证传入 FlowFile 的记录。
	ValidateXml	验证 FlowFile 中包含的 XML。
	VerifyContentMAC	使用提供的密钥计算消息身份验证码，并将其与提供的 MAC 属性进行比较
	VerifyContentPGP	使用 OpenPGP 公钥验证签名

W¶

	处理器	描述
	Wait	将传入的 FlowFiles 路由到“wait”关系，直到在分布式缓存中识别到一个由相应的 Notify 处理器存储的匹配释放信号。
	WaitForTableState	阻止传入的 FlowFiles，直到相应的表状态不等于已接受状态。