设置 Openflow Connector for HubSpot¶

备注

此连接器受 Snowflake 连接器条款的约束。

本主题介绍设置 Openflow Connector for HubSpot 的步骤。

先决条件¶

确保您已查看关于 Openflow Connector for HubSpot。
确保您已安装设置 Openflow - BYOC 或设置 Openflow - Snowflake 部署。
若使用 Openflow - Snowflake Deployments，请确保您已审阅配置所需域名的要求，并已授予对 Hubspot 连接器所需域名的访问权限。

获取凭据¶

作为 HubSpot 管理员，生成 HubSpot 私有应用程序令牌或在您的 HubSpot 账户中创建一个。这使您能够对发送到 HubSpot API 的请求进行身份验证。

登录您的 HubSpot 账户。
选择顶部导航栏中的齿轮图标，导航至 Settings。
在左侧导航栏中，前往 Integrations » Private Apps。
选择 Create a private app。
1. 输入应用程序的名称。
2. 导航到 Scopes 选项卡。
3. 选择您要发出的 API 请求所需的范围。要查找 API 请求所需的范围，请参阅范围 (https://developers.hubspot.com/docs/guides/apps/authentication/scopes)。
4. 选择 Create app。
5. 为每个端点设置您要发出 API 请求所需的范围。
选择 View access token 查看访问令牌。将令牌粘贴到连接器参数中，或将其安全保存。

设置 Snowflake 账户¶

作为 Snowflake 账户管理员，请执行以下任务：

创建新角色或使用现有角色并授予数据库权限和视图权限。
创建类型为 SERVICE 的新 Snowflake 服务用户。
向该 Snowflake 服务用户授予您在前面步骤中创建的角色。
为第 2 步中创建的 Snowflake SERVICE 用户配置密钥对身份验证。
Snowflake 强烈建议执行此步骤。配置 Openflow 支持的密钥管理器（例如 AWS、Azure 和 Hashicorp），并将公钥和私钥存储在密钥存储库中。

备注

如果您出于任何原因不想要使用密钥管理器，则您有责任根据组织的安全策略保护用于密钥对身份验证的公钥和私钥文件。
1. 配置密钥管理器后，确定如何对其进行身份验证。在 AWS 中，建议您使用与 Openflow 关联的 EC2 实例角色，因为这样就无需保留其他密钥。
2. 在 Openflow 中，从右上角的汉堡菜单中配置与此密钥管理器关联的参数提供商。导航到 Controller Settings » Parameter Provider，然后提取您的参数值。
3. 此时，可以使用关联的参数路径引用所有凭据，无需在 Openflow 中保留敏感值。
如果任何其他 Snowflake 用户需要访问连接器引入的原始文档和表（例如，在 Snowflake 中进行自定义处理），则授予这些用户在步骤 1 中创建的角色。

在 Snowflake 中为连接器创建数据库和架构，以存储引入的数据。向第一步中创建的角色授予以下数据库权限权限。

CREATE DATABASE hubspot_destination_db;
CREATE SCHEMA hubspot_destination_db.hubspot_destination_schema;
GRANT USAGE ON DATABASE hubspot_destination_db TO ROLE <hubspot_connector_role>;
GRANT USAGE ON SCHEMA hubspot_destination_db.hubspot_destination_schema TO ROLE <hubspot_connector_role>;
GRANT CREATE TABLE, CREATE VIEW ON SCHEMA hubspot_destination_db.hubspot_destination_schema TO ROLE <hubspot_connector_role>;

创建供连接器使用的仓库，或者使用现有仓库。从最小的仓库规模开始，然后根据要复制的表数量和传输的数据量来测试规模。相较于扩大仓库规模，采用多集群仓库通常能更有效地应对海量表数量的扩展需求。

确保具有连接器所用角色的用户具备使用仓库所需的权限。否则请向该角色授予所需权限。

CREATE WAREHOUSE hubspot_connector_warehouse WITH WAREHOUSE_SIZE = 'X-Small';
GRANT USAGE ON WAREHOUSE hubspot_connector_warehouse TO ROLE <hubspot_connector_role>;

设置连接器¶

作为数据工程师，执行以下任务以安装和配置连接器：

安装连接器¶

要安装连接器，请以数据工程师身份执行以下操作：

导航到 Openflow“Overview”页面。在 Featured connectors 部分中，选择 View more connectors。
在 Openflow 连接器页面上，找到连接器并选择 Add to runtime。
在 Select runtime 对话框中，从 Available runtimes 下拉列表中选择您的运行时，然后点击 Add。

备注

在安装连接器之前，请确保在 Snowflake 中为连接器创建了数据库和架构，用于存储引入的数据。
使用您的 Snowflake 账户凭据对部署进行身份验证，并在系统提示时选择 Allow，以允许运行时应用程序访问您的 Snowflake 账户。连接器安装过程需要几分钟才能完成。
使用您的 Snowflake 账户凭据进行运行时身份验证。

此时将显示 Openflow 画布，其中添加了连接器进程组。

配置连接器¶

右键点击导入的进程组并选择 Parameters。
按照流参数中所述填充所需的参数值。

流参数¶

本节介绍您可以根据以下参数上下文配置的流参数：

HubSpot 源参数：用于与 HubSpot 建立连接。
HubSpot 目标参数：用于与 Snowflake 建立连接。
HubSpot 引入参数：用于定义从 HubSpot 下载的数据的配置。

HubSpot 源参数¶


参数	描述
HubSpot 访问令牌	HubSpot 私有应用程序访问令牌。

HubSpot 目标参数¶


参数	描述	必填
目标数据库	用于永久保存数据的数据库。它必须已存在于 Snowflake 中。名称区分大小写。对于未加引号的标识符，请以大写形式提供名称。	是
目标架构	将持久保存数据的架构，该架构必须已存在于 Snowflake 中。名称区分大小写。对于未加引号的标识符，请提供大写形式的名称。请参阅以下示例： `CREATE SCHEMA SCHEMA_NAME` 或 `CREATE SCHEMA schema_name`：使用 `SCHEMA_NAME` `CREATE SCHEMA "schema_name"` 或 `CREATE SCHEMA "SCHEMA_NAME"`：分别使用 `schema_name` 或 `SCHEMA_NAME`	是
Snowflake 身份验证策略	使用以下方式时： Snowflake Openflow 部署或 BYOC：使用 SNOWFLAKE_MANAGED_TOKEN。此令牌由 Snowflake 自动管理。BYOC 部署必须预先配置了 :ref:` 运行时角色 <label-deployment_byoc_setup_runtime_role>` 才能使用 SNOWFLAKE_MANAGED_TOKEN。 BYOC：或者，BYOC 可以使用 KEY_PAIR 作为身份验证策略的值。	是
Snowflake 账户标识符	使用以下方式时：会话令牌身份验证策略：必须留空。 KEY_PAIR：Snowflake 账户名称格式为 [organization-name]-[account-name]，数据永久保存在其中。	是
Snowflake 私钥	使用以下方式时：会话令牌身份验证策略：必须留空。 KEY_PAIR：必须是用于身份验证的 RSA 私钥。 RSA 密钥必须按照 PKCS8 标准进行格式化，并具有标准的 PEM 头尾标记。请注意，必须定义 Snowflake 私钥文件或 Snowflake 私钥。	否
Snowflake 私钥文件	使用以下方式时：会话令牌身份验证策略：私钥文件必须为空。 KEY_PAIR：上传包含用于向 Snowflake 进行身份验证的 RSA 私钥的文件，该文件应根据 PKCS8 标准格式化，并包含标准的 PEM 页眉和页脚。页眉行以 `-----BEGIN PRIVATE` 开头。要上传私钥文件，请选中 Reference asset 复选框。	否
Snowflake 私钥密码	使用以下方式时：会话令牌身份验证策略：必须留空。 KEY_PAIR：提供与 Snowflake 私钥文件关联的密码。	否
Snowflake 角色	使用以下方式时：会话令牌身份验证策略：使用您的 Snowflake 角色。您可以在 Openflow UI 中，通过导航至您的运行时的 View Details 来找到您的 Snowflake 角色。 KEY_PAIR 身份验证策略：使用为您的服务用户配置的有效角色。	是
Snowflake 用户名	使用以下方式时：会话令牌身份验证策略：必须留空。 KEY_PAIR：提供用于连接到 Snowflake 实例的用户名。	是
超大值处理策略	确定连接器在复制期间如何处理超过内部大小限制 (16 MB) 的值。可能的值：故障表（默认值）：该表将被标记为永久失败，并停止该表的复制。设置 Null：在目标表中将该值替换为 `NULL`。当允许丢弃超过大小限制的数据以防止表复制中断时，可使用此选项。	否
Snowflake 仓库	用于运行查询的 Snowflake 仓库。	是

HubSpot 引入参数¶


参数	描述
对象类型	要导入的 HubSpot 对象类型列表，多个值以逗号分隔。支持的对象类型值包括：预约通话记录广告系列购物车商业支付通信 Companies Contacts 课程 Deals 折扣电子邮件费用 Feedback Submissions Goals 发票 Leads Line Items 列表会议备注订单邮寄邮件 Products 报价单报价单模板服务订阅任务税费 Tickets 用户
之后更新	筛选在指定日期或时间之后更新的对象。此参数是可选的。
数据引入计划	距离下一次计划之间的时间。持续时间应当有效，例如 30 分钟或 1 小时。

运行流¶

右键点击“飞机”图标并选择 Enable all Controller Services。
右键点击导入的进程组并选择 Start。连接器开始数据引入。

重新配置连接器¶

连接器开始引入数据后，您可以修改连接器参数。如果问题查询标准发生变化，请执行以下步骤以确保目标表中的数据一致。

停止连接器：确保所有 Openflow 处理器都已停止。
访问配置设置：在 Snowflake Openflow 界面中导航到连接器的配置设置。
修改参数：根据需要调整参数。
清除处理器状态：如果您要更改引入标准，Snowflake 强烈建议您从头开始引入，以保持目标表中的数据一致。清除 List Fresh HubSpot Objects 处理器中的状态后，连接器将从头开始提取所有对象。可能需要手动截断目标表，以防止行重复。

数据结构和视图¶

连接器在您的 Snowflake 数据库中以以下两种格式存储数据：

原始数据存储¶

所有原始 HubSpot 数据都存储在表中，表名与 Object Types 参数中指定的名称完全一致。例如：

如果您在 Object Types 参数中配置了 Products,Contacts,Companies，连接器将创建三个表：PRODUCTS、CONTACTS 和 COMPANIES。
每个表都包含来自 HubSpot API 响应的完整 JSON 负载。
原始数据保留了来自 HubSpot 的原始结构和所有元数据。

展平视图¶

为了方便查询和分析，连接器会自动为每个对象类型创建展平视图：

每个原始表都有一个相应的视图，视图后缀为 _VIEW。例如，PRODUCTS_VIEW、CONTACTS_VIEW 和 COMPANIES_VIEW。
视图将 JSON 负载中常用的字段提取到独立的列中。
复杂的嵌套结构被展平，以简化 SQL 查询。