Snowpark ML 版本说明¶
本文包含 Snowpark ML 的版本说明,包括以下内容(如果适用):
行为变更
新功能
面向客户的错误修复
备注
这些说明未包含尚未公开发布的功能的变更。
版本 1.1.2(2023 年 12 月 18 日)¶
新功能和更新¶
模型开发更新:
在 SQL 中实施了
precision_score
指标。
错误修复¶
修复了堆栈跟踪被遥测隐藏的问题。
模型开发修复:
推断模型签名不再在内存中实现完整的数据帧。
版本 1.1.1(2023 年 12 月 6 日)¶
新功能和更新¶
指定 Snowpark ML Modeling API 为正式发布。
Modeling API 中的新
passthrough_col
参数使您可以在训练或推理期间,当没有显式指定input_cols
时,排除特定列(如索引列)。
错误修复¶
模型开发修复:
此前,当行号无法除以批大小时,
confusion_matrix
提供的结果不正确。
版本 1.1.0(2023 年 12 月 1 日)¶
新功能和更新¶
GridSearchCV
和RandomizedSearchCV
的执行现已分布在多节点仓库上。
错误修复¶
模型开发修复:
此前,列的规范化名称如果与
OrdinalEncoder
和LabelEncoder
的output_columns
中指定的名称不匹配,则这些列将被排除。输出列不再需要是有效的 Snowflake 标识符。
版本 1.0.12 (2023-11-15)¶
新功能和更新¶
无
错误修复¶
模型开发修复:
增大了
OrdinalEncoder
的列容量。
版本 1.0.11 (2023-10-28)¶
新功能和更新¶
添加了对
kneighbors
的支持。支持
DecimalType
作为数据类型。
错误修复¶
模型开发修复:
修复了对使用 SKLearn Grid Search 和 Randomized Search 模型选择器的 XGBoost 和 LightGBM 模型的支持。
修复了与使用 Snowflake 标识符的 Snowpark DataFrames 的指标兼容性
版本 1.0.10 (2023-10-15)¶
新功能和更新¶
现在,
precision_score
、recall_score
、f1_score
、fbeta_score
、precision_recall_fscore_support
、mean_absolute_error
、mean_squared_error
和mean_absolute_percentage_error
指标的计算以分散方式进行。
错误修复¶
模型开发修复:
修复了在 Windows 上使用建模模块时的 UTF-8 解码错误。
修正了在推理中导致
SnowparkSQLUnexpectedAliasException
的别名定义。
版本 1.0.9 (2023-09-28)¶
新功能和更新¶
现在,
log_loss
指标的计算以分散方式进行。
错误修复¶
模型开发修复:
使用某些 Docker 设置来构建映像不再失败。
当通过 zipimport 导入本地 ML 库时,嵌入该库不再失败。
更新了有关
deploy
函数中的平台实参的不正确文档。
版本 1.0.8 (2023-09-15)¶
新功能和更新¶
无
错误修复¶
模型开发修复:
序数编码器可与混合输入列类型一起使用。
修复了 sklearn 默认值为
np.nan
时的问题。
版本 1.0.7 (2023-09-05)¶
新功能和更新¶
允许禁用遥测。
错误修复¶
模型开发修复:
修复了与
pandas.io.json.json_normalizer
相关的错误。
版本 1.0.6 (2023-09-01)¶
新功能和更新¶
模型开发:指标结果的大小可以超过以前的 8MB 限制。
错误修复¶
模型开发修复:
修复了在 NumPy >= 1.25 的情况下使用简单 imputer 时的错误。
修复了推理标签列类型时的错误。
版本 1.0.5 (2023-08-17)¶
此版本仅包含内部变更。
版本 1.0.4 (2023-07-28)¶
新功能和更新¶
模型开发:现在,可以依据从暂存文件加载的数据来联接输入数据帧。
模型开发:添加了对非英语语言的支持。
错误修复¶
无
版本 1.0.3 (2023-07-14)¶
此版本仅包含内部变更。
版本 1.0.2 (2023-06-22)¶
新功能和更新¶
模型开发:添加的指标:
d2_absolute_error_score
d2_pinball_score
explained_variance_score
mean_absolute_error
mean_absolute_percentage_error
mean_squared_error
错误修复¶
模型开发:现在,当给定的标签列名称是单个值的列表时, accuracy_score
会起效。
版本 1.0.1 (2023-06-16)¶
行为变更¶
模型开发:更改了指标 APIs,以遵从 scikit-learn 指标模块:
accuracy_score
、confusion_matrix
、precision_recall_fscore_support
和precision_score
方法移动到metrics.classification
。
新功能和更新¶
模型开发:添加的指标:
f1_score
fbeta_score
recall_score
roc_auc_score
roc_curve
log_loss
precision_recall_curve
版本 1.0.0 (2023-06-09)¶
初始公开预览版。