Snowpark ML¶
该注册表支持使用 :doc:` Snowpark ML 建模 APIs </developer-guide/snowflake-ml/modeling>` (模型派生自 snowpark.ml.modeling.framework.base.BaseEstimator
)创建的模型。
调用 options
时,可以在 log_model
字典中使用下列附加选项:
选项 |
描述 |
---|---|
|
可在模型对象上使用的方法的名称列表。默认情况下,Snowpark ML 模型具有以下目标方法(假设方法存在): |
在登记 Snowpark ML 模型时,您不需要指定 sample_input_data
或 signatures
;在拟合过程中会自动推断出这些。
备注
Snowpark ML 管道需要估算器。您不能注册仅限转换器的 Snowpark ML 管道。使用 scikit-learn 管道注册转换器。
示例¶
import pandas as pd
import numpy as np
from sklearn import datasets
from snowflake.ml.modeling.xgboost import XGBClassifier
iris = datasets.load_iris()
df = pd.DataFrame(data=np.c_[iris["data"], iris["target"]], columns=iris["feature_names"] + ["target"])
df.columns = [s.replace(" (CM)", "").replace(" ", "") for s in df.columns.str.upper()]
input_cols = ["SEPALLENGTH", "SEPALWIDTH", "PETALLENGTH", "PETALWIDTH"]
label_cols = "TARGET"
output_cols = "PREDICTED_TARGET"
clf_xgb = XGBClassifier(
input_cols=input_cols, output_cols=output_cols, label_cols=label_cols, drop_input_cols=True
)
clf_xgb.fit(df)
model_ref = registry.log_model(
clf_xgb,
model_name="XGBClassifier",
version_name="v1",
)
model_ref.run(df.drop(columns=label_cols).head(10), function_name='predict_proba')