CREATE SNOWFLAKE.ML.CLASSIFICATION

在当前或指定架构中创建新的分类模型或替换现有模型。

另请参阅:

DROP SNOWFLAKE.ML.CLASSIFICATION

语法

CREATE [ OR REPLACE ] SNOWFLAKE.ML.CLASSIFICATION [ IF NOT EXISTS ] <model_name> (
    INPUT_DATA => <input_data>,
    TARGET_COLNAME => '<target_colname>',
    [CONFIG_OBJECT => <config_object>],
)
[ [ WITH ] TAG ( <tag_name> = '<tag_value>' [ , <tag_name> = '<tag_value>' , ... ] ) ]
[ COMMENT = '<string_literal>' ]
Copy

参数

必填

input_data

训练数据的 引用。通过使用引用,即可允许以有限权限运行的训练过程使用活动角色权限访问数据。如果数据已采用相应形式,则可以使用对表或视图的引用,也可以使用 查询引用,来提供要执行的查询以获取数据。

INPUT_DATA 必须包含分类模型要消耗的全部训练数据。TARGET_COLNAME 实参中没有命名的任何列都被视为训练变量(特征)。列在输入数据中的顺序并不重要。

特征列必须为 STRING、NUMERIC 或 BOOLEAN。STRING 和 BOOLEAN 列被视为分类特征,而 NUMERIC 列被视为连续特征。要将数字列视为分类列,请将其转换为 STRING。

target_colname

包含训练数据中每行的标签(目标值)的列的名称。目标列可以是 BOOLEAN、NUMERIC 或 STRING。

可选

config_object

其键值对指定了其他训练选项的 OBJECT

类型

默认值

描述

evaluate

BOOLEAN

TRUE

是否应生成评估指标。如果为 TRUE,则使用 evaluation_config 中的参数训练附加模型以进行评估。

on_error

STRING

'ABORT'

指定模型训练任务的错误处理方法的字符串常量。支持的值包括:

  • 'ABORT':如果任何一行出现错误,则终止整个训练操作。

  • 'SKIP':跳过出现错误的行。显示的是错误,而不是结果。

evaluation_config

OBJECT

NULL

可选配置对象,用于指定如何生成样本外评估指标。目前,只有一个这样的选项。

  • test_fraction (FLOAT):数据集中用作测试(评估)数据的部分。

如果未指定评估配置,默认情况下会尽量在评估集中包含至少 500 个少数群体实例,并将总测试分数限制在数据集的 20%。这种方法保持了模型评估和训练的平衡,特别是对少数类而言。

访问控制要求

用于执行此操作的 角色 必须至少具有以下 权限

权限/角色

对象

备注

CREATE SNOWFLAKE.ML.CLASSIFICATION

架构

用于创建预算的角色必须获授在其中创建预算的架构的这一权限。

OWNERSHIP

架构

若要创建创建与架构中已存在的对象同名的临时对象,必须授予角色或使其继承对象上的 OWNERSHIP 权限。

model_name!mladmin

SNOWFLAKE.ML.CLASSIFICATION 实例

此角色的作用域为模型本身,最初授予所有者,所有者可将其授予其他人,以允许他们调用模型的所有方法。请参阅 模型角色和使用权限

model_name!mlconsumer

SNOWFLAKE.ML.CLASSIFICATION 实例

此角色的作用域为模型本身,最初授予所有者,所有者可将其授予其他人,以允许他们调用模型的预测方法(例如,PREDICT)。请参阅 模型角色和使用权限

Operating on an object in a schema requires at least one privilege on the parent database and at least one privilege on the parent schema.

有关创建具有指定权限集的自定义角色的说明,请参阅 创建自定义角色

有关对 安全对象 执行 SQL 操作的相应角色和权限授予的一般信息,请参阅 访问控制概述

示例

请参阅 示例

语言: 中文