FINETUNE ('CREATE') (SNOWFLAKE.CORTEX)

创建微调作业。将调优的模型保存到架构的模型注册表中。

语法

SNOWFLAKE.CORTEX.FINETUNE(
  'CREATE',
  '<name>',
  '<base_model>',
  '<training_data_query>',
  [ '<validation_data_query>' ],
  [ '<options>' ]
)
Copy

必填参数

'CREATE'

指定您要创建微调作业。

'name'

保存到模型注册表的微调模型的标识符。这对于它保存到的模型注册表必须是唯一的。如果多个模型尝试使用相同的名称保存,则会在后一个模型的名称后附加后缀,以使其唯一。

标识符中允许使用字母、下划线、十进制数字 (0-9)。

此外,标识符必须以字母字符开头,且不能包含空格或特殊字符,除非整个标识符字符串放在双引号内(例如,"My object")。放在双引号内的标识符也区分大小写。

有关更多信息,请参阅 标识符要求

'base_model'

指定要微调的基本模型的字符串。这必须是以下值之一:

  • 'llama3-8b'

  • 'llama3-70b'

  • 'llama3.1-8b'

  • 'llama3.1-70b'

  • 'mistral-7b'

  • 'mixtral-8x7b'

'training_data_query'

获取训练数据的 SQL 查询。结果必须包括 promptcompletion 列。

可选参数

'validation_data_query'

获取验证数据的 SQL 查询。结果必须包括 promptcompletion 列。如果未指定验证数据查询,则训练数据将自动拆分为训练数据和验证数据。

'options'

JSON 对象的字符串表示,包含零或影响训练超参数的以下多个选项。例如:'{"max_epochs": 3}'

  • max_epochs:一个从 1 到 10(包括 10)的值,用于控制训练模型的纪元数。

    默认值:由系统自动确定

返回

类型

描述

FINETUNE

STRING

创建优化作业时,将返回生成的唯一作业 ID。

访问控制要求

权限

对象

备注

USAGE

DATABASE

从其中查询训练(和验证)数据的数据库。

CREATE MODEL 或 OWNERSHIP

SCHEMA

保存模型的架构。

示例

验证数据示例:

SELECT SNOWFLAKE.CORTEX.FINETUNE(
  'CREATE',
  'my_tuned_model',
  'mistral-7b',
  'SELECT prompt, completion FROM train',
  'SELECT prompt, completion FROM validation'
);
Copy

无验证数据的示例:

SELECT SNOWFLAKE.CORTEX.FINETUNE(
  'CREATE',
  'my_tuned_model',
  'mistral-7b',
  'SELECT prompt, completion FROM train'
);
Copy

输出是微调作业的作业 ID,例如:

ft_6556e15c-8f12-4d94-8cb0-87e6f2fd2299
语言: 中文