2022 年 2 月¶
本月推出了以下新功能、行为变更和更新(增强、修复等)。如果您对这些新增功能有任何疑问,请联系 Snowflake 支持部门 (https://community.snowflake.com/s/article/How-To-Submit-a-Support-Case-in-Snowflake-Lodge)。
重要
每个版本都可能包含需要刷新 Web 界面的更新。
为确保这些更新不会影响您的使用,我们建议的一般做法是在部署每个 Snowflake 版本后刷新 Web 界面。
本主题内容:
新功能¶
Amazon Web Services 上的 Java UDTFs – 正式发布¶
在此版本中,Snowflake 很高兴地宣布,Amazon Web Services (AWS) 上的 Java UDTFs (用户定义的表格函数)支持功能已正式发布。
Java UDTFs 将表函数的优势与 Java 编程的强大功能、灵活性和简易性相结合,从而扩展了 Snowflake 的本地开发功能。
有关更多信息,请参阅 表格 Java UDFs (UDTFs)。
Data Classification – 预览版¶
在此版本中,Snowflake 很高兴地宣布,为所有使用 Snowflake Enterprise Edition(或更高版本)的账户推出 Data Classification预览版。
分类功能可对存储在 Snowflake 表和视图中的潜在个人和/或敏感数据进行分类,然后可用于实现各种数据管理、共享和隐私使用案例,包括:
PII (个人身份信息)数据的分类。
用于设置和控制私密数据访问权限的策略管理。
个人数据的匿名化。
有关更多信息,请参阅 分类简介。
Object Dependencies – 预览版¶
在此版本中,Snowflake 很高兴地宣布对 Object Dependencies 的预览支持。对象依赖关系意味着,为了对对象进行操作,正在操作的对象必须引用自身的元数据或至少引用一个其他对象的元数据。
Snowflake 在 Account Usage 视图 OBJECT_DEPENDENCIES 中跟踪对象依赖关系。要发现对象依赖关系,请查询 OBJECT_DEPENDENCIES 视图。
有关更多信息,请参阅 对象依赖关系。
Snowpark Stored Procedures – 预览版¶
在此版本中,我们很高兴地宣布支持 Snowpark Stored Procedures,您可以使用 Snowpark API 在 Scala 中编写存储过程。
在存储过程中,您可以使用 Snowpark API for Scala 在 Snowflake 中托管您的数据管道。例如,当您需要在不运行客户端应用程序的情况下(如从任务中)执行 Snowpark 代码时,您可以编写存储过程。
新区域¶
我们很高兴地宣布,以下新区域将立即投入使用:
云平台 |
区域 |
---|---|
Microsoft Azure |
UAE 北部(迪拜) |
随着该区域的加入,Snowflake 现在支持三个云平台(AWS、GCP 和 Azure)的 30 个全球区域,其中包括三个支持遵守 US 政府法规的区域。
新区域支持所有 Snowflake 版本。您可以通过 自助服务 (https://signup.snowflake.com/) 或 Snowflake 代表在区域中预置初始账户。
SQL 更新¶
Account Usage:新视图¶
此版本现在提供 ACCOUNT_USAGE 架构中的以下函数:
视图 |
描述 |
---|---|
ACCOUNT_USAGE 视图为每个对象依赖性显示一行。 例如,当从单个表创建视图时,视图依赖于该表。Snowflake 返回一行,以记录视图对表的依赖关系。 有关更多信息,请参阅 Object Dependencies – 预览版 (本主题内容)。 |
数据加载更新¶
Snowpipe:使用 Google Cloud Storage 事件通知进行自动加载 – 正式发布¶
在此版本中,我们很高兴地宣布,由 Google Cloud Storage (GCS) 事件通知触发的 Snowpipe 数据加载功能已正式发布,该事件通知通过 Google Cloud Pub/Sub(即“自动引入 Snowpipe for GCS”)进行传递。
请注意,用于 Amazon S3 或 Microsoft Azure Blob 存储的自动引入 Snowpipe 已正式发布。
数据管道更新¶
任务:手动执行运行 – 预览版¶
在此版本中,我们很高兴地宣布,预览版能够手动执行单次计划任务(即任务树中的独立任务或根任务)。执行根任务的运行会触发树中子任务的级联运行,就像根任务按照其定义的计划运行一样。以前,计划任务只能在下一次计划运行发生时启动。
该功能是通过新的 SQL 命令 EXECUTE TASK 来实现的,该命令可以由任务所有者(即具有任务的 OWNERSHIP 权限的角色)或任何具有任务的 OPERATE 权限的角色执行。SQL 命令触发任务的异步运行。
EXECUTE TASK 命令用于测试新的或修改过的独立任务,然后再将其纳入生产计划。在脚本或存储过程中调用此 SQL 命令,或使用第三方工具或服务执行命令,将任务集成到外部数据管道中。
数据湖更新¶
Delta Lake 的外部表支持 – 预览版¶
在此版本中,我们很高兴地宣布推出对外部表中的 Delta Lake (https://delta.io/) 的预览支持。Delta Lake 是数据湖中的一种表格格式,支持 ACID (原子性、一致性、隔离性、持久性)事务以及其他功能。Delta Lake 中的所有数据都以 Apache Parquet 格式存储。
通过创建外部表来查询 Delta Lake 中的 Parquet 文件,该外部表可引用通过 Delta Lake 增强的云存储位置。
预览版功能用于评估和测试目的,不建议在生产环境中使用。
数据共享更新¶
生态系统更新¶
SQL API:端点更新¶
在此版本中,SQL API 的端点现在包括 API 的版本。更新的端点包括:
/api/v2/statements/
/api/v2/statements/statementHandle
/api/v2/statements/statementHandle/cancel
向这些新端点发送请求时,不需要将 resultSetMetaData
字段中的 format
字段设置为 jsonv2
。如果在请求中设置了 format
字段,则 SQL API 忽略该字段。
SQL API 较旧的、已弃用的版本不支持更改端点或 format
字段。使用此版本的 SQL API 时,您必须使用原始端点并提供 format
字段作为请求的一部分。
SQL API:支持同时提取¶
在此版本中,SQL API 消除了同时提取结果的限制(即与多个线程并行)。SQL API 支持来自多个线程的请求。
此更改不适用于 SQL API 较旧的、已弃用的版本。