CREATE SNOWFLAKE.ML.CLASSIFICATION¶
在当前或指定架构中创建新的分类模型或替换现有模型。
语法¶
CREATE [ OR REPLACE ] SNOWFLAKE.ML.CLASSIFICATION [ IF NOT EXISTS ] <model_name> (
INPUT_DATA => <input_data>,
TARGET_COLNAME => '<target_colname>',
[CONFIG_OBJECT => <config_object>],
)
[ [ WITH ] TAG ( <tag_name> = '<tag_value>' [ , <tag_name> = '<tag_value>' , ... ] ) ]
[ COMMENT = '<string_literal>' ]
参数¶
必填
input_data
训练数据的 引用。通过使用引用,即可允许以有限权限运行的训练过程使用活动角色权限访问数据。如果数据已采用相应形式,则可以使用对表或视图的引用,也可以使用 查询引用,来提供要执行的查询以获取数据。
INPUT_DATA 必须包含分类模型要消耗的全部训练数据。TARGET_COLNAME 实参中没有命名的任何列都被视为训练变量(特征)。列在输入数据中的顺序并不重要。
特征列必须为 STRING、NUMERIC 或 BOOLEAN。STRING 和 BOOLEAN 列被视为分类特征,而 NUMERIC 列被视为连续特征。要将数字列视为分类列,请将其转换为 STRING。
target_colname
包含训练数据中每行的标签(目标值)的列的名称。目标列可以是 BOOLEAN、NUMERIC 或 STRING。
可选
config_object
其键值对指定了其他训练选项的 OBJECT。
键
类型
默认值
描述
评估
TRUE
是否应生成评估指标。如果为 TRUE,则使用
evaluation_config
中的参数训练附加模型以进行评估。on_error
STRING
'ABORT'
指定模型训练任务的错误处理方法的字符串常量。支持的值包括:
'ABORT'
:如果任何一行出现错误,则终止整个训练操作。'SKIP'
:跳过出现错误的行。显示的是错误,而不是结果。
evaluation_config
NULL
可选配置对象,用于指定如何生成样本外评估指标。目前,只有一个这样的选项。
test_fraction
(FLOAT):数据集中用作测试(评估)数据的部分。
如果未指定评估配置,默认情况下会尽量在评估集中包含至少 500 个少数群体实例,并将总测试分数限制在数据集的 20%。这种方法保持了模型评估和训练的平衡,特别是对少数类而言。
访问控制要求¶
权限/角色 |
对象 |
备注 |
---|---|---|
CREATE SNOWFLAKE.ML.CLASSIFICATION |
架构 |
用于创建预算的角色必须获授在其中创建预算的架构的这一权限。 |
OWNERSHIP |
架构 |
若要创建创建与架构中已存在的对象同名的临时对象,必须授予角色或使其继承对象上的 OWNERSHIP 权限。 |
|
SNOWFLAKE.ML.CLASSIFICATION 实例 |
此角色的作用域为模型本身,最初授予所有者,所有者可将其授予其他人,以允许他们调用模型的所有方法。请参阅 模型角色和使用权限。 |
|
SNOWFLAKE.ML.CLASSIFICATION 实例 |
此角色的作用域为模型本身,最初授予所有者,所有者可将其授予其他人,以允许他们调用模型的预测方法(例如, |
请注意,对架构中的对象进行操作还需要对父数据库和架构具有 USAGE 权限。
有关创建具有指定权限集的自定义角色的说明,请参阅 创建自定义角色。
示例¶
请参阅 示例。