Snowflake ML Python 版本说明¶
本文包含 Snowflake ML Python 的版本说明,包括以下内容(如果适用):
行为变更
新功能
面向客户的错误修复
备注
这些说明未包含尚未公开宣布的功能的变更。此类功能可能会显示在 Snowflake ML Python 源代码中,但不会显示在公开的文档中。
有关文档,请参阅 Snowflake ML:端到端机器学习。
验证 snowflake-ml-python 包¶
所有 Snowflake 包都带有签名,允许您验证其来源。要验证 snowflake.ml.python 包,请按照以下步骤操作:
安装
cosign。此示例使用 Go 安装:使用 Go 安装 cosign (https://edu.chainguard.dev/open-source/sigstore/cosign/how-to-install-cosign/#installing-cosign-with-go)。从 PyPi (https://pypi.org/project/snowflake-ml-python/#files) 等存储库下载文件。
从 GitHub 版本页面 (https://github.com/snowflakedb/snowflake-ml-python/releases/) 下载该版本的
.sig文件。使用
cosign验证签名。例如:
备注
此示例使用包版本 1.27.0 的库和签名。使用您正在验证的版本的文件名。
弃用声明¶
snowflake.ml.fileset.FileSet已弃用,并将在未来版本中移除。改为使用 snowflake.ml.dataset.Dataset 和 snowflake.ml.data.DataConnector。snowflake.ml.cortex中的“CamelCase”函数名称已弃用,将在未来版本中移除。改为使用这些函数的“snake_case”名称。例如,使用classify_text代替ClassifyText。partitioned_inference_api装饰器已弃用,并将在未来版本中移除。请改用custom_model.partitioned_api。MLJob.submit_*方法的additional_payloads实参已被弃用,并将在未来版本中移除。请改用imports实参。snowflake.ml.model.models.huggingface_pipeline.HuggingfacePipelineModel类已弃用,并将在未来版本中移除。
版本 1.27.0 (2026-02-12)¶
错误修复¶
模型注册表错误修复:
修复了
model_version.run故障问题,该问题起因是,当用户角色仅有 USAGE 权限时,需要模型的 READ 权限(而非 USAGE 权限)。
特征商店错误修复:
修复了以下情况下出现的
register_feature_view与overwrite=True故障问题:现有特征视图是外部特征视图,而新特征视图是托管的特征视图,反之亦然。
版本 1.26.0 (2026-02-05)¶
新功能¶
新的模型注册表功能:
模型签名现在可以通过
ParamSpec包含推理参数,允许您定义要在推理时传递的常量参数,而无需将其包含在输入数据中。示例:
新的特征商店功能:
新增
auto_prefix参数和with_name方法,用于在数据集生成中联接多个特征视图时防止列名冲突。动态 Iceberg 表现在可以用作特征视图的后备存储。使用
StorageConfig与StorageFormat.ICEBERG在外部云存储上以 Apache Iceberg 格式存储数据。FeatureStore中新增default_iceberg_external_volume参数,用于为 Iceberg 特征视图设置默认外部卷。
版本 1.25.1 (2026-02-03)¶
没有面向公众的变更。此版本包括对尚未公开宣布的预览版功能的变更。
版本 1.25.0 (2026-01-28)¶
新功能¶
新的模型服务功能:
create_service方法接受了新的autocapture实参,用于指示是否应获取推理数据(请参阅 自动捕获推理日志以进行实时推理)。create_service和log_model_and_create_service方法现已接受可选的min_instances实参,用于指定服务的最小实例数。该服务会根据流量和硬件利用率自动在指定的最小和最大实例数之间进行扩展。如果min_instances为 0,在一段时间内未检测到流量时,该服务会自动暂停。min_instances的默认值为 0。
版本 1.24.0 (2026-01-22)¶
新功能¶
新的特征商店功能:
支持基于磁贴的聚合,使用全新的
FeatureAPI,并通过预先计算的磁贴实现高效且时间点正确的时间序列特征计算。
新的模型注册表功能:
SentenceTransformer 模型现在支持自动签名推理。记录 SentenceTransformer 模型时,
sample_input_data是可选的。未提供样本输入数据时,将自动根据模型的嵌入维度推断签名。支持encode、encode_query、encode_document、encode_queries、encode_documents方法。
版本 1.23.0 (2026-01-165)¶
新功能¶
新的 ML 作业功能:
ML Jobs 现在支持 Python 3.11 和 Python 3.12。Jobs 会自动选择与客户端 Python 版本匹配的运行时环境。
错误修复¶
模型注册表错误修复:
HuggingFace 的词元分类(命名实体识别)模型中的空输出不再导致失败。
模型服务错误修复:
容器状态现在可以正确报告,不应为空白。
版本 1.22.0(2026 年 1 月 9 日)¶
新功能¶
新的模型注册表功能:
现在,您可以通过 Snowpark Container Services (SPCS) 作业远程记录转换器管道模型。
版本 1.21.0(2026 年 1 月 5 日)¶
行为变更¶
ML 作业行为变更:
additional_payloads参数的行为发生了变化。使用imports实参声明额外依赖项,例如 ZIP 文件和 Python 模块。本地目录和 Python 文件会自动压缩,其内部布局由指定的导入路径决定。导入路径仅适用于本地目录、Python 文件和暂存的 Python 文件;对其他导入类型无影响。在暂存区中引用文件时,仅支持单个文件,不支持目录。
实验跟踪行为变更:
ExperimentTracking现在为单例类。
错误修复¶
实验跟踪错误修复:
达到
log_metrics或log_params的运行元数据大小限制时,将发出警告,而不是引发异常。
模型注册表错误修复:
如果模型为 SPCS 仅模型且未提供
service_name,ModelVersion.run现在会引发ValueError。
新的预览版功能¶
create_service方法现在接受布尔实参autocapture,用于指示是否自动捕获推理数据。
新版本功能¶
新的模型注册表功能:
新的
snowflake.ml.model.models.huggingface.TransformersPipeline类旨在替换snowflake.ml.model.models.huggingface_pipeline.HuggingfacePipelineModel,但旧类尚未弃用。新类能识别常见任务的模型签名,因此无需手动指定。目前支持的任务包括:fill-maskquestion-answeringsummarizationtable-question-answeringtext2text-generationtext-classification(别名:sentiment-analysis)text-generationtoken-classification(别名:ner)translationtranslation_xx_to_yyzero-shot-classification(允许您在不将模型加载到内存的情况下记录模型)
``list_services``API 现在显示内部端点,可从另一个 SPCS 节点或笔记本调用,无需 Enterprise Application Integration。它还显示每项服务是否启用了自动捕获。
新 DataConnector 功能:
新
to_huggingface_dataset方法将 Snowflake 数据转换为 HuggingFace 数据集。支持内存中Dataset(streaming=False) 和流式IterableDataset(streaming=True) 模式。
弃用声明¶
snowflake.ml.model.models.huggingface_pipeline.HuggingfacePipelineModel类已弃用,并将在未来版本中移除。