GetFTP 2025.10.2.19

捆绑包

org.apache.nifi | nifi-standard-nar

描述

从 FTP 服务器提取文件并从这些文件中创建 FlowFiles

标签

FTP、fetch、files、get、ingest、input、remote、retrieve、source

输入要求

FORBIDDEN

支持敏感的动态属性

false

属性

属性

描述

连接模式

FTP 连接模式

连接超时

创建连接时在超时之前要等待的时间

数据超时

在本地和远程系统之间传输文件时,此值规定了系统间无数据传输的最长允许间隔时间

删除原件

确定成功传输文件后是否将其从远程系统中删除

文件筛选器正则表达式

提供用于筛选文件名的 Java 正则表达式;如果提供了筛选器,则仅提取名称与该正则表达式匹配的文件

主机名

远程系统的完全限定主机名或 IP 地址

忽略带点的文件

如果为 true,则忽略名称以点(“.”)开头的文件

内部缓冲区大小

为缓冲数据流设置内部缓冲区大小

最大选择数

每次连接中允许拉取的最大文件数

密码

用户账户的密码

路径筛选器正则表达式

当递归搜索为 true 时,只会扫描路径与给定正则表达式匹配的子目录

轮询间隔

确定在提取新文件列表之间的等待时间

端口

远程系统正在其上监听文件传输的端口

远程路径

远程系统上用于提取或推送文件的路径

远程轮询批次大小

The value specifies how many file paths to find in a given directory on the remote system when doing a file listing. This value in general should not need to be modified but when polling against a remote system with a tremendous number of files this value can be critical. Setting this value too high can result very poor performance and setting it too low can cause the flow to be slower than normal.

递归搜索

如果为 true,将从任意嵌套的子目录中提取文件;否则,不会遍历子目录

传输模式

FTP 传输模式

使用自然排序

如果为 true,将按照文件自然列出的顺序提取文件;否则,不会定义提取文件的顺序

用户名

用户名

follow-symlink

如果为 true,则将提取偶数符号文件和嵌套的符号子目录;否则,将不读取符号文件,也不会遍历符号链接子目录

ftp-use-utf8

告知客户端在处理文件和文件名时使用 UTF-8 编码。如果设置为 true,则服务器还必须支持 UTF-8 编码。

proxy-configuration-service

指定代理配置控制器服务来代理网络请求。

关系

名称

描述

success

所有收到的 FlowFiles 都将路由至“success”

写入属性

名称

描述

filename

文件名设置为远程服务器上文件的名称

path

该路径设置为远程服务器上文件目录的路径。例如,如果将 <Remote Path> 属性设置为 /tmp,则从 /tmp 提取的文件路径属性将设置为 /tmp。如果将 <Search Recursively> 属性设置为 true 并且从 /tmp/abc/1/2/3 中提取了一个文件,则路径属性将设置为 /tmp/abc/1/2/3

file.lastModifiedTime

上次修改源文件的日期和时间

file.lastAccessTime

上次访问该文件的日期和时间。可能不适用于所有文件系统

file.owner

源文件的所有者 ID 的数字值

file.group

源文件的组 ID 数字值

file.permissions

源文件的读取/写入/执行权限

absolute.path

从中提取文件的完整/绝对路径。当前的“path”属性仍会被赋值,但它可能是一个相对路径

另请参阅

语言: 中文