Data Clean Room 开发者指南¶
本主题为希望以编程方式创建或管理 Snowflake Data Clean Room Collaboration 的用户提供指南。
开发工具¶
以下是 Snowflake Data Clean Room Collaboration 的主要开发者工具:
编码环境: 任何可以在您的 Snowflake 账户中运行存储过程的编码环境都可以运行。大多数开发者使用 Snowsight 中的工作表(基于浏览器的工具)或 Snowflake CLI。
Cortex Code: Data Clean Room 程序也可通过 :doc:` Cortex Code</user-guide/cortex-code/cortex-code>` 在代理体验中使用。
设置您的环境¶
以下是有效使用 Snowflake Data Clean Room API 来设置编码环境的一些技巧。
使用 Collaboration API¶
Snowflake 提供 Data Clean Room Collaboration API 来创建和管理协作。此 API 由存储过程组成,这些过程可以在任何可以访问您的 Snowflake 账户的环境中运行。这包括 Snowsight 笔记本、工作区、工作表和 Snowflake CLI。
这里的文档显示了 SQL 的用法,但您也可以使用 Python 或 任何其他支持的 Snowflake 语言。
您可以授予用户通过特定 DCR 权限 访问完整 API 或其子集的访问权限。
备注
您需要相应的 DCR 权限 才能使用 Collaboration API。您可以通过 基于角色的精细度访问控制 向子组用户授予对特定程序的有限访问权限。
SAMOOHA_APP_ROLE 具有对整个 API 的预配置访问权限。
选择仓库¶
您必须在您的角色具有 USAGE 权限的仓库中使用 Collaboration API。APP_WH 是您可以使用的 仓库数量 的其中之一。 是 众多可以访问 的仓库 之一。根据您的需求选择合适的仓库。
任何 Standard Warehouse 都适用于常规协作编辑、创建或删除命令。在运行机器学习工作负载等大型分析时,请考虑使用更大的仓库或 Snowpark-Optimized Warehouses。如果使用 Snowpark-optimized Warehouse 来审查或加入协作,请确保将 MAX_CONCURRENCY_LEVEL 设置为大于或等于 2 的值。
设置测试账户¶
您应该至少拥有两个具有完全编码访问权限的独立账户,以便能够开发和测试多方协作。
根据您的用例,您可能还希望在不同的云托管区域中使用 Snowflake 测试账户,以便测试 跨云行为。
为您的测试 Snowflake 账户命名,以表明其典型用途:例如“Cross-cloud account”或“Standard Edition account”。当您有多个测试账户,并且必须在 Clean Room 登录页面上选择一个账户时,这会有所帮助。
参考和资源¶
以下主题对 Snowflake Data Clean Room 开发者非常有用。
参考主题:
在 Snowflake Data Clean Room 环境中安装的项目:选择使用 时默认使用的角色和仓库。SDCR 环境安装了哪些对象。
示例数据:
故障排除: 请参阅 Data Clean Room 故障排除指南 获取提示。
有用的协作元数据: 请参阅 元数据备忘单 了解如何获取有关协作的有用元数据,例如协作者(包括您自己)是否安装了给定的协作。
查看您的 API查询历史记录: 查看您进行的 Collaboration API (或其他) 调用历史记录:
登录 Snowsight。
在导航菜单中,选择 Monitoring » Query History。
使用筛选器查找与分析关联的查询,然后选择查询或分析。
功能示例: 为帮助您了解如何使用 Collaboration API 的各种功能,您可以参考 Snowflake DCR 文档的 Use cases 和 Key concepts & features 部分。
其他示例和视频: 有关其他代码示例、教程和视频,请参阅 Sample Notebooks and Worksheets。