Data Clean Room 开发者指南

本主题为希望以编程方式创建或管理 Snowflake Data Clean Room Collaboration 的用户提供指南。

开发工具

以下是 Snowflake Data Clean Room Collaboration 的主要开发者工具:

  • 编码环境: 任何可以在您的 Snowflake 账户中运行存储过程的编码环境都可以运行。大多数开发者使用 Snowsight 中的工作表(基于浏览器的工具)或 Snowflake CLI

  • Cortex Code: Data Clean Room 程序也可通过 :doc:` Cortex Code</user-guide/cortex-code/cortex-code>` 在代理体验中使用。

设置您的环境

以下是有效使用 Snowflake Data Clean Room API 来设置编码环境的一些技巧。

使用 Collaboration API

Snowflake 提供 Data Clean Room Collaboration API 来创建和管理协作。此 API 由存储过程组成,这些过程可以在任何可以访问您的 Snowflake 账户的环境中运行。这包括 Snowsight 笔记本、工作区、工作表和 Snowflake CLI

这里的文档显示了 SQL 的用法,但您也可以使用 Python 或 任何其他支持的 Snowflake 语言

您可以授予用户通过特定 DCR 权限 访问完整 API 或其子集的访问权限。

备注

您需要相应的 DCR 权限 才能使用 Collaboration API。您可以通过 基于角色的精细度访问控制 向子组用户授予对特定程序的有限访问权限。

SAMOOHA_APP_ROLE 具有对整个 API 的预配置访问权限。

选择仓库

您必须在您的角色具有 USAGE 权限的仓库中使用 Collaboration API。APP_WH 是您可以使用的 仓库数量 的其中之一。 是 众多可以访问 的仓库 之一。根据您的需求选择合适的仓库。

任何 Standard Warehouse 都适用于常规协作编辑、创建或删除命令。在运行机器学习工作负载等大型分析时,请考虑使用更大的仓库或 Snowpark-Optimized Warehouses。如果使用 Snowpark-optimized Warehouse 来审查或加入协作,请确保将 MAX_CONCURRENCY_LEVEL 设置为大于或等于 2 的值。

设置测试账户

您应该至少拥有两个具有完全编码访问权限的独立账户,以便能够开发和测试多方协作。

根据您的用例,您可能还希望在不同的云托管区域中使用 Snowflake 测试账户,以便测试 跨云行为

为您的测试 Snowflake 账户命名,以表明其典型用途:例如“Cross-cloud account”或“Standard Edition account”。当您有多个测试账户,并且必须在 Clean Room 登录页面上选择一个账户时,这会有所帮助。

参考和资源

以下主题对 Snowflake Data Clean Room 开发者非常有用。