2024 年 Snowflake Connector for Spark 版本说明¶
本文包含 Snowflake Connector for Spark 的版本说明,包括以下内容(如果适用):
行为变更
新功能
面向客户的错误修复
Snowflake 对 Snowflake Connector for Spark 更新使用语义版本控制。
有关文档,请参阅 Snowflake Connector for Spark。
版本 3.0.0(2024 年 7 月 31 日)¶
BCR (行为变更版本)变更¶
从版本 3.0.0 开始,Snowflake Connector for Spark 推出了以下重大变更:
移除了高级查询下推功能。
该功能有其他替代方案。例如,用户可以直接从 Snowflake SQL 查询加载数据,而不是从 Snowflake 表加载数据。
在未来的 Snowflake Connector for Spark 版本中,Snowflake 计划推出一款工具,用于在 Spark 和 Snowpark 之间转换 DataFrames。
每个版本现在都包含一个工件,而非包含适用于不同 Spark 版本的多个工件。
单个工件可与多个 Spark 版本配合使用。目前,在 Snowflake Connector for Spark 版本 3.0.0 中,已验证 Snowflake 支持 Spark 3.4 和 3.5。
根据 Snowflake 的支持策略,Snowflake 将继续支持 Spark 2.xx 版本最多两年时间。
新功能¶
将 JDBC 升级到了 3.17.0 以支持 LOB。
添加了对 Spark 3.5.0 的支持。
错误修复¶
移除了使用 OAUTH 时
SFUSER
参数的要求。
版本 2.16.0(2024 年 6 月 10 日)¶
新功能¶
将 JDBC 升级到了版本 3.16.1。
改进了传统的 Spark 流代码。
默认情况下,在会话级别禁用了
abort_detached_query
参数。
错误修复¶
修复了代理协议中对 S3 协议存在错误影响的问题。
版本 2.15.0(2024 年 2 月 26 日)¶
新功能¶
引入了新
trim_space
参数,在保存到 Snowflake 表时,您可以使用该参数自动修剪StringType
列的值。默认:false
。
错误修复¶
修复了导致“cancelled queries can be restarted in the Spark retries after application closed”消息的问题。