2022 年 3 月

本月推出了以下新功能、行为变更和更新(增强、修复等)。如果您对这些新增功能有任何疑问,请联系 Snowflake 支持部门 (https://community.snowflake.com/s/article/How-To-Submit-a-Support-Case-in-Snowflake-Lodge)。

重要

每个版本都可能包含需要刷新 Web 界面的更新。

为确保这些更新不会影响您的使用,我们建议的一般做法是在部署每个 Snowflake 版本后刷新 Web 界面。

本主题内容:

新功能

适用于 Java 的 Snowpark Stored Procedures – 预览版

在此版本中,我们很高兴地宣布支持适用于 Java 的 Snowpark 存储过程,您可以使用 Snowpark API 在 Java 中编写存储过程。

在存储过程中,可以使用 Snowpark API for Java 在 Snowflake 中托管数据管道。例如,当您需要在不运行客户端应用程序的情况下(如从任务中)执行 Snowpark 代码时,您可以编写存储过程。

有关更多信息,请参阅 使用 Java 编写存储过程

Snowpark API for Java – 预览版

在此版本中,我们很高兴地推出 Snowpark API for Java 的预览版。

Snowpark 是一种全新的开发者体验,为在数据管道中查询和处理数据提供了直观的 API。使用该库,您可以构建在 Snowflake 中处理数据的应用程序,而无需将数据移至您的应用程序代码运行所在的系统。

预览版功能用于评估和测试目的,不建议在生产环境中使用。

有关更多信息,请参阅 Snowpark API

安全更新

SCIM 更新:支持密码同步

在此版本中,Snowflake 添加了支持,以启用或禁用从 Okta 同步密码,作为 SCIM API 请求到 Snowflake 的一部分。

有关详细信息,请参阅 CREATE SECURITY INTEGRATION 和 ALTER SECURITY INTEGRATION:新的 SCIM SYNC_PASSWORD 属性 (这些版本说明)。

SQL 更新

CREATE SECURITY INTEGRATION 和 ALTER SECURITY INTEGRATION:新的 SCIM SYNC_PASSWORD 属性

在此版本中,Okta 和自定义 SCIM 安全集成支持 SYNC_PASSWORD 属性,允许将用户密码从 SCIM 客户端同步到 Snowflake:

  • 如果该属性设置为 TRUE,并且 在 Okta 中启用了密码同步,则会发生密码同步。如果未在 CREATE SECURITY INTEGRATION 语句中指定,则默认值为 TRUE。

  • 如果属性设置为 FALSE,则不会进行密码同步。

请注意以下事项:

  • Microsoft Azure SCIM 集成不支持使用此属性的密码同步,因为 Microsoft Azure 不支持密码同步。要请求支持,请联系 Microsoft Azure。

  • 如果启用了 SSO,同步密码可能会允许用户绕过 SSO 进入 Snowflake。在启用 SYNC_PASSWORD 属性之前,请联系您的内部管理员,确保密码同步不会干扰 SSO 到 Snowflake。

ALTER PIPE 命令:新增对标签的支持

在此版本中,Snowflake 增加了对使用相应 ALTER PIPE 语句在管道上设置标签的支持:

语法

描述

ALTER PIPE <name> SET TAG <tag_name> = '<tag_value>' [ , <tag_name>= '<tag_value>' ... ]

ALTER PIPE <name> UNSET TAG <tag_name> [ , <tag_name> ... ]

指定标签名称(即键)和标签值。

标签值始终为字符串,标签值的最大字符数为 256。可以在对象上设置的唯一标签键的最大数量为 20。

生态系统更新

Snowflake SQL API – 正式发布

在此版本中,Snowflake 很高兴地宣布 Snowflake SQL API 已公开发布。Snowflake SQL API 是一个 REST API,您可以使用它通过 SQL 来访问和更新 Snowflake 数据库中的数据。

备注

此正式发布版本仅包括 SQL API 的第 2 版端点。版本 1 端点不受支持,并将在未来的版本中弃用。

虚拟仓库更新

延迟和并发性改进 – 正式发布

在此版本中,我们很高兴地宣布,所有区域的延迟和并发性均已得到改善。这些变更提高了并发查询处理能力和吞吐量,加快了查询执行速度。对于具有交互式使用案例(例如仪表盘或数据应用程序)的客户而言,这些更改可提高数据的新鲜度并减少查询延迟。默认情况下,所有仓库都会启用这些改进功能。

有关更多详情,请参阅 Snowflake 博客

数据加载更新

检测已暂存 Apache Parquet、Apache Avro 或 ORC 文件中的列定义 – 正式发布

在此版本中,我们很高兴地宣布,现已全面 支持从云存储中包含半结构化数据的一组文件中检索列定义。列定义包括文件中列的名称和数据类型。使用列定义可以简化标准登录表、外部表或视图的创建操作,以便查询数据。

请注意,此功能仍仅限于 Apache Parquet、Apache Avro 和 ORC 文件。

数据管道更新

视图上的流 – 预览版

在此版本中,表流已扩展到跟踪视图(包括安全视图)的变更数据获取 (CDC) 记录。请注意,不支持物化视图。

目前,流仅适用于满足以下要求的视图:

  • 所有基础表都必须是原生表。

  • 该视图只能应用以下操作:

    • 预测

    • 筛选器

    • 内联接或交叉联接

    • UNION ALL

有关视图上的流要求的更多信息,请参阅 Streams 简介

数据使用者可在使用 Snowflake 安全数据共享的安全视图上创建流。此功能使数据使用者能够跟踪共享视图中的数据操作语言 (DML) 更改。在跟踪共享视图的更改之前,数据提供商必须明确启用源视图的变更跟踪。然后,数据使用者可以在自己的账户中为共享视图创建一个或多个表流。

请注意,表流已正式发布,但跟踪视图更改的功能目前还处于预览阶段。预览版功能用于评估和测试目的,不建议在生产环境中使用。

数据湖更新

目录表和外部表:使用 Google Pub/Sub 自动刷新元数据

在此版本中,您可以配置指向 Google Cloud Storage 中云存储位置的目录表或外部表的自动元数据刷新。刷新会将对象元数据与外部暂存区和路径中相关文件集的更改同步。刷新操作可通过使用 Google Pub/Sub 事件通知服务的对象创建或对象删除事件自动触发。

要配置目录表或外部表的自动元数据刷新,请设置对象的 AUTO_REFRESH = TRUE 参数:分层目录表或外部表的暂存区。可以在创建对象(使用 CREATE <object>)时或稍后(使用 ALTER <object>)设置此参数。通过 Google Pub/Sub 为您的存储位置创建事件通知,以便在创建或删除数据文件时通知 Snowflake。

在此版本之前,对象所有者(即拥有暂存区或外部表 OWNERSHIP 权限的角色)或更高级别的角色必须手动更新目录表或外部表元数据(分别使用 ALTER STAGE ... REFRESH 或 ALTER EXTERNAL TABLE ... REFRESH)。

数据治理更新

Object Tagging:新增对管道的支持

在这个版本中,Snowflake 很高兴地宣布可标记的对象:

架构级对象:管道

有关更多信息,请参阅 ALTER PIPE 命令:新增对标签的支持 (本主题内容)。

文档和学习资源

连接器、驱动程序和库版本说明的新位置

从 2022 年 1 月的版本开始,连接器、驱动程序和库的所有版本说明信息现已发布在 Snowflake 社区网站上。Snowflake 连接器、驱动程序和库每月发布 按月列出这些组件的更新版本。

有关 2022 年 1 月之前版本的版本说明信息,请参阅 Snowflake 服务器版本的版本说明

语言: 中文