为使用 SQL 创建的存储过程编写 Scala 处理程序¶

您可以创建一个存储过程，其处理程序是用 Scala 编写。您可以在存储过程中使用 Snowpark 库对 Snowflake 中的表执行查询、更新和其他操作。

借助存储过程，您可以使用Snowflake 仓库作为计算框架，在 Snowflake 中构建和运行数据管道。对于数据管道的代码，您可以使用 Snowpark API for Scala 编写存储过程。若要计划这些存储过程的执行，请使用任务。

您可以在处理程序代码执行时获取日志和跟踪数据。有关更多信息，请参阅日志记录、跟踪和指标。

为存储过程编写 Scala 处理程序¶

备注

要创建和调用匿名过程，请使用 CALL（使用匿名过程）。创建和调用匿名过程不需要具有 CREATE PROCEDURE 架构权限的角色。

Snowflake 目前支持使用 Scala 的以下版本编写过程：

您必须使用版本 1.1.0 或更新版本的 Snowpark 库。

如果要编写处理程序代码将被复制到暂存区的存储过程，则必须编译类才能在 Java 版本 11.x 中运行。

如果您在本地开发代码，请设置您的开发环境以使用 Snowpark 库。请参阅为 Snowpark Scala 设置开发环境。

您可以使处理程序源代码与创建过程的 SQL 保持一致，或者将处理程序编译的结果保留在单独的位置，并从 SQL 中引用它。有关更多信息，请参阅将处理程序代码保持内联或保留在暂存区。

有关构建用于过程的处理程序源代码的更多信息，请参阅打包处理程序代码。

编写处理程序类或对象时，请注意以下几点：

为存储过程编写方法或函数时，请注意以下事项：

指定 Snowpark Session 对象作为方法或函数的第一个实参。

调用存储过程时，Snowflake 会自动创建一个 Session 对象并将其传递给存储过程。（您不能自行创建 Session 对象。）
对于其余实参和返回值，请使用与 Snowflake 数据类型相对应的 Scala 类型。
方法或函数必须返回一个值。
存储过程执行超时，除非代码活动重置计时器。具体而言，超时计时器通过代码与数据之间的交互（包括文件操作、查询和迭代结果集）重置。
当您运行来自过程处理程序中的异步子作业时，不支持“发后即忘”。

换句话说，如果处理程序发出的子查询在父存储过程作业完成时仍在运行，子作业就会自动取消。

为确保代码在 Snowflake 上运行良好，请遵循以下指南：

限制消耗的内存量。

Snowflake 根据所需的内存量对方法进行了限制。有关如何避免消耗过多内存的更多信息，请参阅设计保持在 Snowflake 施加的约束范围内的处理程序。
编写线程安全代码。

确保您的处理程序方法或函数是线程安全的。
了解安全限制。

处理程序代码在受限引擎中运行，因此请务必遵循 UDFs 和过程的安全实践中所述的规则。
决定使用所有者权限还是调用方权限。

在计划编写存储过程时，请考虑希望存储过程使用调用方权限还是所有者权限运行。
请记住存储过程的超时行为。

存储过程执行超时，除非代码活动重置计时器。具体而言，超时计时器通过代码与数据之间的交互（包括文件操作、查询和迭代结果集）重置。

如果处理程序代码依赖在处理程序之外（如 JAR 文件中的类）定义的代码或依赖资源文件，则可以通过将这些依赖项上传到暂存区来为代码提供这些依赖项。创建过程时，可以使用 IMPORTS 子句引用这些依赖项。

有关更多信息，请参阅为代码提供依赖项。