CaptureSharepointChanges 2025.5.31.15

捆绑包

com.snowflake.openflow.runtime | runtime-msgraph-nar

描述

从 Sharepoint 文档库中捕获变更,并对发生的每个变更发出 FlowFile。这包括添加和删除文件和文件夹,以及对权限、元数据和文件内容的更改。

标签

cdc、document、experimental、graph、library、microsoft、openflow、sharepoint、unstructured

输入要求

FORBIDDEN

支持敏感的动态属性

false

属性

属性

描述

身份验证服务

为 SharePoint API 提供身份验证的服务

变更捕获初始操作

如果处理器在没有任何先前状态的情况下运行,则此属性决定处理器应如何处理现有的 Sharepoint 项目。

文档库名称

要列出的文档库的名称。如果未指定,则将列出与本站点相关的所有文档库。

回退重试持续时间

通信失败后重试操作所需的等待时间。当响应不包含 Retry-After 标头时,使用此值。

文件夹名称

要列出的文件夹/目录的名称

站点 URL

将从中检索数据的 Sharepoint 站点的 URL。

状态管理

范围

描述

CLUSTER

存储每个 Sharepoint 文件夹的令牌,以跟踪有关哪些事件已被捕获的状态。

关系

名称

描述

created

FlowFile对于创建的每个 Sharepoint 项目,都会将 A 路由到此关系。

deleted

对于每个已删除的 Sharepoint 项目,都会将 FlowFile 路由到此关系。

updated

对于每个已更新的 Sharepoint 项目,都会将 FlowFile 路由到此关系。

写入属性

名称

描述

sharepoint.change.type

发生的变更的类型。可能的值为“Created”、“Updated”、“PermissionsUpdated”、“Deleted”。

sharepoint.item.id

已更改的 Sharepoint 项目的 ID。

sharepoint.item.type

已更改的 Sharepoint 项目的类型。可能的值为“File”和“Folder”。

sharepoint.path

已更改的 Sharepoint 项目的路径。这是相对于文档库根目录的路径。

sharepoint.filename

已更改的 Sharepoint 项目的名称。此属性不适用于“Deleted”的变更。

sharepoint.size

已更改的 Sharepoint 项目的大小。

sharepoint.createdAt

已更改的 Sharepoint 项目的创建时间戳。

sharepoint.lastModified

已更改的 Sharepoint 项目的上次修改时间戳。

sharepoint.createdBy.<identity>.id

创建已更改的 Sharepoint 项目的身份 ID。此属性并不总是可用。

sharepoint.createdBy.<identity>.displayName

创建已更改的 Sharepoint 项目的身份的显示名称。此属性并不总是可用。

sharepoint.createdBy.<identity>.email

创建已更改的 Sharepoint 项目的身份的电子邮件。此属性并不总是可用。

sharepoint.lastModifiedBy.<identity>.id

修改已更改的 Sharepoint 项目的身份 ID。此属性并不总是可用。

sharepoint.lastModifiedBy.<identity>.displayName

修改已更改的 Sharepoint 项目的身份的显示名称。此属性并不总是可用。

sharepoint.lastModifiedBy.<identity>.email

修改已更改的 Sharepoint 项目的身份的电子邮件。此属性并不总是可用。

sharepoint.drive.id

包含已更改项目的 Sharepoint Drive 的 ID。

sharepoint.drive.name

包含已更改项目的 Sharepoint Drive 的名称。

sharepoint.site.id

包含已更改项目的 Sharepoint Site 的 ID。

sharepoint.site.url

包含已更改项目的 Sharepoint Site 的 URL。

sharepoint.ctag

已更改的 Sharepoint 项目的 CTag。

sharepoint.etag

已更改的 Sharepoint 项目的 ETag。

sharepoint.webUrl

已更改的 Sharepoint 项目的浏览器视图 URL。

sharepoint.permissions.read.groups

对已更改的 Sharepoint 项目具有读取权限的组的逗号分隔列表。对于每个组,如果某个电子邮件地址在 Sharepoint 中可用,则该地址将包括在内。此外,还包括小组负责人,例如 mygroup@mytenant.onmicrosoft.com

sharepoint.permissions.read.groups.ids

对 Sharepoint 项目具有读取权限的组 IDs 的逗号分隔列表。

sharepoint.permissions.read.users

对已更改的 Sharepoint 项目具有读取权限的用户的逗号分隔列表。对于每个用户,如果某个电子邮件地址在 Sharepoint 中可用,则该用户将包括在内。此外,还包括用户负责人,例如 johndoe@mytenant.onmicrosoft.com

sharepoint.permissions.read.users.ids

对 Sharepoint 项目具有读取权限的 Microsoft365 用户 IDs 的逗号分隔列表。

sharepoint.permissions.read.siteusers

对 Sharepoint 项目具有读取权限的 Sharepoint 站点用户电子邮件的逗号分隔列表。

sharepoint.permissions.read.siteusers.ids

对 Sharepoint 项目具有读取权限的 Sharepoint 站点用户 IDs 的逗号分隔列表。

sharepoint.permissions.read.sitegroups.ids

对 Sharepoint 项目具有读取权限的 Sharepoint 站点组 IDs 的逗号分隔列表。

filename

已更改的 Sharepoint 项目的名称。此属性不适用于“Deleted”的变更。

path

已更改的 Sharepoint 项目的路径。这是相对于文档库根目录的路径。

mime.type

已更改的 Sharepoint 项目的 MIME 类型。此属性仅适用于“File”项目。

hash.quickxor

已更改的 Sharepoint 项目的 QuickXor 哈希。此属性并不总是可用。

hash.sha256

已更改的 Sharepoint 项目的 SHA-256 哈希。此属性并不总是可用。

hash.sha1

已更改的 Sharepoint 项目的 SHA-1 哈希。此属性并不总是可用。

hash.crc32

已更改的 Sharepoint 项目的 CRC32 哈希。此属性并不总是可用。

涉及其他组件的用例

在 Sharepoint 文档库上执行变更数据捕获,检索文档库中的所有数据,包括权限,以保持目标系统与 Sharepoint 同步。

另请参阅

语言: 中文