规划数据加载

本主题提供规划数据加载的最佳实践、一般准则和重要注意事项。

本主题内容:

使用不同的仓库执行加载和查询操作

加载大型数据集可能会影响查询性能。我们建议使用不同的仓库执行加载和查询操作,以优化每项操作的性能。

可以并行处理的数据文件数由仓库中的计算资源量决定。如果遵循 准备数据文件 中描述的文件大小调整指南,则数据加载只需要最少的资源。拆分较大的数据文件可使负载线性扩展。除非同时批量加载大量文件(即数百或数千个文件),否则一般使用较小的仓库(小、中、大)就足够了。使用更大的仓库(“X-大”、“2X-大”等)会消耗更多 credit,而且可能不会带来任何性能提升。

语言: 中文