Snowpark ML 版本说明

本文包含 Snowpark ML 的版本说明,包括以下内容(如果适用):

  • 行为变更

  • 新功能

  • 面向客户的错误修复

备注

这些说明未包含尚未公开发布的功能的变更。

版本 1.1.2(2023 年 12 月 18 日)

新功能和更新

模型开发更新:

  • 在 SQL 中实施了 precision_score 指标。

错误修复

  • 修复了堆栈跟踪被遥测隐藏的问题。

模型开发修复:

  • 推断模型签名不再在内存中实现完整的数据帧。

版本 1.1.1(2023 年 12 月 6 日)

新功能和更新

  • 指定 Snowpark ML Modeling API 为正式发布。

  • Modeling API 中的新 passthrough_col 参数使您可以在训练或推理期间,当没有显式指定 input_cols 时,排除特定列(如索引列)。

错误修复

  • 模型开发修复:

    • 此前,当行号无法除以批大小时,confusion_matrix 提供的结果不正确。

版本 1.1.0(2023 年 12 月 1 日)

新功能和更新

  • GridSearchCVRandomizedSearchCV 的执行现已分布在多节点仓库上。

错误修复

  • 模型开发修复:

    • 此前,列的规范化名称如果与 OrdinalEncoderLabelEncoderoutput_columns 中指定的名称不匹配,则这些列将被排除。输出列不再需要是有效的 Snowflake 标识符。

版本 1.0.12 (2023-11-15)

新功能和更新

错误修复

  • 模型开发修复:

    • 增大了 OrdinalEncoder 的列容量。

版本 1.0.11 (2023-10-28)

新功能和更新

  • 添加了对 kneighbors 的支持。

  • 支持 DecimalType 作为数据类型。

错误修复

  • 模型开发修复:

    • 修复了对使用 SKLearn Grid Search 和 Randomized Search 模型选择器的 XGBoost 和 LightGBM 模型的支持。

    • 修复了与使用 Snowflake 标识符的 Snowpark DataFrames 的指标兼容性

版本 1.0.10 (2023-10-15)

新功能和更新

  • 现在,precision_scorerecall_scoref1_scorefbeta_scoreprecision_recall_fscore_supportmean_absolute_errormean_squared_errormean_absolute_percentage_error 指标的计算以分散方式进行。

错误修复

  • 模型开发修复:

    • 修复了在 Windows 上使用建模模块时的 UTF-8 解码错误。

    • 修正了在推理中导致 SnowparkSQLUnexpectedAliasException 的别名定义。

版本 1.0.9 (2023-09-28)

新功能和更新

  • 现在, log_loss 指标的计算以分散方式进行。

错误修复

  • 模型开发修复:

    • 使用某些 Docker 设置来构建映像不再失败。

    • 当通过 zipimport 导入本地 ML 库时,嵌入该库不再失败。

    • 更新了有关 deploy 函数中的平台实参的不正确文档。

版本 1.0.8 (2023-09-15)

新功能和更新

错误修复

  • 模型开发修复:

    • 序数编码器可与混合输入列类型一起使用。

    • 修复了 sklearn 默认值为 np.nan 时的问题。

版本 1.0.7 (2023-09-05)

新功能和更新

  • 允许禁用遥测。

错误修复

  • 模型开发修复:

    • 修复了与 pandas.io.json.json_normalizer 相关的错误。

版本 1.0.6 (2023-09-01)

新功能和更新

  • 模型开发:指标结果的大小可以超过以前的 8MB 限制。

错误修复

  • 模型开发修复:

    • 修复了在 NumPy >= 1.25 的情况下使用简单 imputer 时的错误。

    • 修复了推理标签列类型时的错误。

版本 1.0.5 (2023-08-17)

此版本仅包含内部变更。

版本 1.0.4 (2023-07-28)

新功能和更新

  • 模型开发:现在,可以依据从暂存文件加载的数据来联接输入数据帧。

  • 模型开发:添加了对非英语语言的支持。

错误修复

版本 1.0.3 (2023-07-14)

此版本仅包含内部变更。

版本 1.0.2 (2023-06-22)

新功能和更新

  • 模型开发:添加的指标:

    • d2_absolute_error_score

    • d2_pinball_score

    • explained_variance_score

    • mean_absolute_error

    • mean_absolute_percentage_error

    • mean_squared_error

错误修复

模型开发:现在,当给定的标签列名称是单个值的列表时, accuracy_score 会起效。

版本 1.0.1 (2023-06-16)

行为变更

  • 模型开发:更改了指标 APIs,以遵从 scikit-learn 指标模块:

    • accuracy_scoreconfusion_matrixprecision_recall_fscore_supportprecision_score 方法移动到 metrics.classification

新功能和更新

  • 模型开发:添加的指标:

    • f1_score

    • fbeta_score

    • recall_score

    • roc_auc_score

    • roc_curve

    • log_loss

    • precision_recall_curve

版本 1.0.0 (2023-06-09)

初始公开预览版。

语言: 中文