2024 年性能改进

重要

性能改进通常针对特定的查询模式或工作负载。这些改进可能会对特定工作负载产生实质性影响,也可能不会。

2024 年推出了以下性能改进。

发布时间

描述

影响

2024 年 5 月

改进了 LIMIT 和 ORDER BY 查询的 top-k 修剪。

由于扫描的文件和文件标头读取减少,减少了 top-k 查询的执行时间。扩展了现有的 top-k 改进,以在 ORDER BY 列中添加 STRING/BINARY 支持。通过相对于值域按最大/最小文件的顺序对扫描集进行排序,进一步提高了修剪效率。

2024 年 5 月

通过计算更具粒度的选择性估计值,改进了联接顺序决策。

通过在微分区级别计算选择性估计值来减少编译时间和查询执行时间。

2024 年 5 月

加快 Python 的加载时间。

提高 Streamlit in Snowflake 应用程序(包括 Snowflake Native App 中的 Streamlit 应用程序)、Python 工作表、Python UDFs 和 Python 中的存储过程的性能。

2024 年 4 月

改进了广播联接决策。

通过在类似右深层连接树这样的场景中优化广播连接,减少了查询执行时间并改进了内存管理。

2024 年 4 月

更快地在 Snowsight 中获得查询结果。

减少了查询结果在 Snowsight 中运行时显示所需的时间。对于返回结果集大于 10,000 行的查询,改进最为明显。

2024 年 3 月

通过更准确地计算选择性估计值以优化联接顺序,提高了查询性能。

减少了分区元数据与联接筛选器的实际基数不匹配时的执行时间。

2024 年 3 月

提高了加载 JSON 文件的性能。

为许多 JSON 加载场景降低高达 25% 的引入延迟。

2024 年 2 月

对一些函数新增了 upperlower 排序规则支持。

能够设置某些函数的 upperlower 排序规则规范。对于某些用例,upperlower 排序规则的性能优于 ci 规范。以下函数现在支持 upperlower 排序规则规范:CHARINDEXCONTAINSENDSWITHPOSITIONSPLITSPLIT_PARTSTARTSWITH。有关更多信息,请参阅 ci 和 upper / lower 的区别

2024 年 1 月

改进了 LIMIT 0 查询的执行时间。

减少了使用带有 LIMIT0 计数的查询的执行时间,应用程序通常使用该计数返回查询结果的列标题和数据类型。

2024 年 1 月

在 Microsoft Azure 区域(不包括 Azure 政府区域)中正式发布 大型仓库 (5X-LARGE 和 6X-LARGE)。

与较小的仓库相比,大型仓库能够使用较大的计算资源进行内存密集型查询。

语言: 中文