CREATE SNOWFLAKE.ML.CLASSIFICATION

在当前或指定架构中创建新的分类模型或替换现有模型。

另请参阅:

DROP SNOWFLAKE.ML.CLASSIFICATION

语法

CREATE [ OR REPLACE ] SNOWFLAKE.ML.CLASSIFICATION [ IF NOT EXISTS ] <model_name> (
    INPUT_DATA => <input_data>,
    TARGET_COLNAME => '<target_colname>',
    [CONFIG_OBJECT => <config_object>],
)
[ [ WITH ] TAG ( <tag_name> = '<tag_value>' [ , <tag_name> = '<tag_value>' , ... ] ) ]
[ COMMENT = '<string_literal>' ]
Copy

参数

必填

input_data

训练数据的 引用。通过使用引用,即可允许以有限权限运行的训练过程使用活动角色权限访问数据。如果数据已采用相应形式,则可以使用对表或视图的引用,也可以使用 查询引用,来提供要执行的查询以获取数据。

INPUT_DATA 必须包含分类模型要消耗的全部训练数据。TARGET_COLNAME 实参中没有命名的任何列都被视为训练变量(特征)。列在输入数据中的顺序并不重要。

特征列必须为 STRING、NUMERIC 或 BOOLEAN。STRING 和 BOOLEAN 列被视为分类特征,而 NUMERIC 列被视为连续特征。要将数字列视为分类列,请将其转换为 STRING。

target_colname

包含训练数据中每行的标签(目标值)的列的名称。目标列可以是 BOOLEAN、NUMERIC 或 STRING。

可选

config_object

其键值对指定了其他训练选项的 OBJECT

类型

默认值

描述

评估

BOOLEAN

TRUE

是否应生成评估指标。如果为 TRUE,则使用 evaluation_config 中的参数训练附加模型以进行评估。

on_error

STRING

'ABORT'

指定模型训练任务的错误处理方法的字符串常量。支持的值包括:

  • 'ABORT':如果任何一行出现错误,则终止整个训练操作。

  • 'SKIP':跳过出现错误的行。显示的是错误,而不是结果。

evaluation_config

OBJECT

NULL

可选配置对象,用于指定如何生成样本外评估指标。目前,只有一个这样的选项。

  • test_fraction (FLOAT):数据集中用作测试(评估)数据的部分。

如果未指定评估配置,默认情况下会尽量在评估集中包含至少 500 个少数群体实例,并将总测试分数限制在数据集的 20%。这种方法保持了模型评估和训练的平衡,特别是对少数类而言。

访问控制要求

用于执行此 SQL 命令的 角色 必须至少具有以下 权限

权限/角色

对象

备注

CREATE SNOWFLAKE.ML.CLASSIFICATION

架构

用于创建预算的角色必须获授在其中创建预算的架构的这一权限。

OWNERSHIP

架构

若要创建创建与架构中已存在的对象同名的临时对象,必须授予角色或使其继承对象上的 OWNERSHIP 权限。

model_name!mladmin

SNOWFLAKE.ML.CLASSIFICATION 实例

此角色的作用域为模型本身,最初授予所有者,所有者可将其授予其他人,以允许他们调用模型的所有方法。请参阅 模型角色和使用权限

model_name!mlconsumer

SNOWFLAKE.ML.CLASSIFICATION 实例

此角色的作用域为模型本身,最初授予所有者,所有者可将其授予其他人,以允许他们调用模型的预测方法(例如,PREDICT)。请参阅 模型角色和使用权限

请注意,对架构中的对象进行操作还需要对父数据库和架构具有 USAGE 权限。

有关创建具有指定权限集的自定义角色的说明,请参阅 创建自定义角色

有关对 安全对象 执行 SQL 操作的相应角色和权限授予的一般信息,请参阅 访问控制概述

示例

请参阅 示例

语言: 中文