GetFTP 2025.5.31.15¶
捆绑包¶
org.apache.nifi | nifi-standard-nar
描述¶
从 FTP 服务器提取文件并从这些文件中创建 FlowFiles
输入要求¶
FORBIDDEN
支持敏感的动态属性¶
false
属性¶
属性 |
描述 |
---|---|
连接模式 |
FTP 连接模式 |
连接超时 |
创建连接时在超时之前要等待的时间 |
数据超时 |
在本地和远程系统之间传输文件时,此值规定了系统间无数据传输的最长允许间隔时间 |
删除原件 |
确定成功传输文件后是否将其从远程系统中删除 |
文件筛选器正则表达式 |
提供用于筛选文件名的 Java 正则表达式;如果提供了筛选器,则仅提取名称与该正则表达式匹配的文件 |
主机名 |
远程系统的完全限定主机名或 IP 地址 |
忽略带点的文件 |
如果为 true,则忽略名称以点(“.”)开头的文件 |
内部缓冲区大小 |
为缓冲数据流设置内部缓冲区大小 |
最大选择数 |
每次连接中允许拉取的最大文件数 |
密码 |
用户账户的密码 |
路径筛选器正则表达式 |
当递归搜索为 true 时,只会扫描路径与给定正则表达式匹配的子目录 |
轮询间隔 |
确定在提取新文件列表之间的等待时间 |
端口 |
远程系统正在其上监听文件传输的端口 |
远程路径 |
远程系统上用于提取或推送文件的路径 |
远程轮询批次大小 |
该值指定在执行文件列表时,要在远程系统的给定目录中查找多少个文件路径。通常不需要修改此值,但是当对包含大量文件的远程系统进行轮询时,此值可能很关键。 将此值设置得过高可能会导致性能极差,而将其设置得太低可能会导致流比正常速度慢。 |
递归搜索 |
如果为 true,将从任意嵌套的子目录中提取文件;否则,不会遍历子目录 |
传输模式 |
FTP 传输模式 |
使用自然排序 |
如果为 true,将按照文件自然列出的顺序提取文件;否则,不会定义提取文件的顺序 |
用户名 |
用户名 |
follow-symlink |
如果为 true,则将提取偶数符号文件和嵌套的符号子目录;否则,将不读取符号文件,也不会遍历符号链接子目录 |
ftp-use-utf8 |
告知客户端在处理文件和文件名时使用 UTF-8 编码。如果设置为 true,则服务器还必须支持 UTF-8 编码。 |
proxy-configuration-service |
指定代理配置控制器服务来代理网络请求。 |
关系¶
名称 |
描述 |
---|---|
success |
所有收到的 FlowFiles 都将路由至“success” |
写入属性¶
名称 |
描述 |
---|---|
filename |
文件名设置为远程服务器上文件的名称 |
path |
该路径设置为远程服务器上文件目录的路径。例如,如果将 <Remote Path> 属性设置为 /tmp,则从 /tmp 提取的文件路径属性将设置为 /tmp。如果将 <Search Recursively> 属性设置为 true 并且从 /tmp/abc/1/2/3 中提取了一个文件,则路径属性将设置为 /tmp/abc/1/2/3 |
file.lastModifiedTime |
上次修改源文件的日期和时间 |
file.lastAccessTime |
上次访问该文件的日期和时间。可能不适用于所有文件系统 |
file.owner |
源文件的所有者 ID 的数字值 |
file.group |
源文件的组 ID 数字值 |
file.permissions |
源文件的读取/写入/执行权限 |
absolute.path |
从中提取文件的完整/绝对路径。当前的“path”属性仍会被赋值,但它可能是一个相对路径 |