2025 年 8 月 20 日:Snowflake ML 中的分布式处理:多模型训练与分布式分区函数¶
Snowflake ML 现在支持分布式处理功能,用于训练多个模型和跨分区处理数据。
您可以使用多模型训练 (MMT) 来高效地跨数据分区训练多个机器学习模型。MMT 按您指定的列对 Snowpark DataFrame 进行分区,并在每个分区上并行训练不同的模型。
您可以使用分布式分区函数 (DPF) 在计算池中的一个或多个节点上并行处理数据。DPF 按您指定的列对 Snowpark DataFrame 进行分区,并在每个分区上并行执行 Python 函数。
这两种功能都可以帮助您处理基础设施的复杂性并自动扩展。
有关更多信息,请参阅 跨数据分区训练模型 和 使用自定义逻辑跨分区处理数据。