Snowpark Python 开发者指南¶
Snowpark 库 提供直观 API,用于查询和处理数据管道中的数据。使用 Snowpark 库,您可以构建用于在 Snowflake 中处理数据的应用程序,而无需将数据移至您的应用程序代码运行所在的系统。您还可以通过在 Snowflake 中编写存储过程并将这些过程安排为任务来自动进行数据转换和处理。
开始使用¶
您可以在本地开发环境中或在 Snowsight 的 Python 工作表中编写 Snowpark Python 代码。
如果您需要编写客户端应用程序,请执行以下操作来设置本地开发环境:
设置您的首选开发环境来构建 Snowpark 应用程序。请参阅 为 Snowpark Python 设置开发环境。
建立与 Snowflake 数据库进行交互的会话。请参阅 为 Snowpark Python 创建会话。
如果您想编写存储过程来自动执行 Snowflake 中的任务,请使用 Snowsight 中的 Python 工作表。请参阅 在 Python 工作表中编写 Snowpark 代码。
编写 Snowpark Python 代码¶
您可以使用 Snowpark Python 以多种方式查询、处理和转换数据。
使用
DataFrame
对象查询和处理数据。请参阅 在 Snowpark Python 中使用 DataFrames。将自定义 lambda 和函数转换为用户定义的函数 (UDFs),您可以调用这些函数来处理数据。请参阅 在 Python 中为 DataFrames 创建用户定义函数 (UDFs)。
编写用户定义的表格函数 (UDTF) 来处理数据并返回一组包含一列或多列的行中的数据。请参阅 在 Python 中为 DataFrames 创建用户定义的表函数 (UDTFs)。
编写一个存储过程,您可以调用它来处理数据,或者通过任务自动执行构建数据管道的任务。请参阅 在 Python 中为 DataFrames 创建存储过程。
执行机器学习任务¶
您可以使用 Snowpark Python 来执行机器学习任务,比如训练模型:
通过编写存储过程来训练机器学习模型。请参阅 使用 Snowpark Python 训练机器学习模型。
使用 Snowpark Python 存储过程训练、评分和调整机器学习模型,并使用用户定义的函数部署经过训练的模型。请参阅 使用 Snowpark Python 进行机器学习 – 信用卡审批预测 (https://quickstarts.snowflake.com/guide/getting_started_snowpark_machine_learning/index.html) (Snowflake Quickstarts)。
对 Snowpark Python 代码进行故障排除¶
通过日志记录语句和查看基础 SQL,对代码进行故障排除。请参阅 使用 Snowpark Python 进行故障排除。
记录和分析有关代码执行的数据¶
您可以在事件表中记录日志消息和跟踪事件,以供日后分析。有关更多信息,请参阅 日志记录和跟踪概述。
API 参考¶
Snowpark for Python API 参考包含有关可用类和方法的大量详细信息。请参阅 Snowpark Library for Python API 参考。
要查看各个版本之间 API 的更改列表,请参阅 Snowpark Library for Python 版本说明。