创建笔记本

本主题介绍如何在仓库运行时中创建 Snowflake 笔记本。您还可以在容器运行时中创建笔记本。有关详细信息,请参阅 ML 的容器运行时的笔记本

Snowflake Notebooks 在 Snowsight 中提供了一个基于单元格的交互式开发环境。它们使您能够在单个界面中使用 SQL 和 Python 处理 Snowflake 数据,从而更轻松地构建和迭代用于数据探索、转换及机器学习的工作流程。

您可以通过 Snowsight 访问笔记本,并在其中 创建新笔记本打开现有笔记本。您还可以使用 SQL 创建笔记本。有关更多信息,请参阅 CREATE NOTEBOOK

先决条件

运行时

在使用仓库运行时创建笔记本时,您需要指定名称、位置和仓库。在此预览中,您还可以为笔记本选择特定的预配置运行时环境。使用 Snowflake 默认运行时环境可确保您的笔记本在一致的设置下运行,从而支持可重现的结果。此设置无需初始配置,可立即使用。

Snowflake 仓库运行时环境由以下组件组成:

Snowflake 仓库运行时版本

Python 运行时

Streamlit 版本

1.0

3.9

1.39.1

2.0

3.10

1.39.1

所有新笔记本都默认使用 Python 3.9 运行时(仓库运行时 1.0)。

备注

如果您在 Snowflake 运行时基础上安装软件包,Snowflake 将无法再保证整个环境的兼容性。

创建新笔记本

您可以通过选择 + Notebook 来创建新笔记本,或者您可以导入具有 *.ipynb 扩展的文件。这可能是从 Snowflake 之外的应用程序创建的笔记本文件。

要创建新笔记本,请按照以下步骤操作:

  1. 登录 Snowsight

  2. 在左侧导航菜单中选择 Projects » Notebooks

  3. 选择 + Notebook

  4. 输入笔记本的名称。Snowflake 保留输入的笔记本名称的确切大小写,包括包含空格的名称。笔记本名称区分大小写。

  5. 选择 Notebook location。这是存储您的笔记本的数据库和架构。创建笔记本后,这些内容便无法更改。

    备注

    Notebook location 列表可能不显示打开 Create Notebook 对话框后创建的数据库。如果您找不到最近创建的数据库、架构或仓库,请重新加载浏览器窗口。

    在笔记本中查询数据并不局限于此位置。在笔记本中,您可以查询可以访问的任意位置的数据。要指定位置,请运行 USE WAREHOUSEUSE SCHEMA

  6. 选择 Run on warehouse 作为您的 Python 环境。有关每个运行时所包含内容的详细信息,请参阅 笔记本运行时

    有关容器运行时的详细信息,请参阅 ML 的容器运行时的笔记本

  7. 可选:选择 Query warehouse 来运行笔记本发出的任何 SQL 和 Snowpark 查询。

  8. 选择一个 Notebook warehouse 来运行笔记本特定的任务。Snowflake 建议您使用 SYSTEM$STREAMLIT_NOTEBOOK_WH,这是一个由 Snowflake 管理的仓库,在用于运行笔记本的每个账户中提供。

  9. 选择 Create 来创建和打开笔记本。

要从现有文件创建新笔记本,请执行以下步骤:

  1. 选择 + Notebook 旁边的向下箭头,然后选择 Import .ipynb file

  2. 打开要导入的文件,例如通过 Snowflake 之外的应用程序创建的笔记本文件。

    备注

    如果您的笔记本导入了 Python 包,您必须在运行导入的笔记本之前将这些包添加到笔记本中。请参阅 导入 Python 包以在笔记本中使用。如果您在导入的笔记本中使用的包不可用,您的代码可能无法运行。有关添加单元格的信息,请参阅 在 Snowflake Notebooks 中开发和运行代码

使用 SQL 创建笔记本

您可以使用 CREATE NOTEBOOK 命令创建笔记本。此命令允许您以编程方式定义笔记本的位置、主文件和版本源。但是,当您使用 SQL 创建笔记本时,笔记本不会自动包含实时版本。使用 EXECUTE NOTEBOOK 命令运行笔记本需要实时版本。

如果您尝试运行没有实时版本的笔记本,或者该笔记本已删除并重新创建,则可能会看到以下错误:

Live version is not found.

要解决此问题,请在执行笔记本之前向其添加实时版本,如以下示例所示:

ALTER NOTEBOOK DB_NAME.SCHEMA_NAME.NOTEBOOK_NAME ADD LIVE VERSION FROM LAST;
Copy
  • DB_NAME 是包含笔记本的数据库的名称

  • SCHEMA_NAME 是包含笔记本的架构的名称。

  • NOTEBOOK_NAME 是笔记本的名称

从 Git 存储库创建笔记本

您可以将笔记本开发与 Git 存储库同步。然后您可以从该 Git 存储库中的笔记本创建 Snowflake Notebooks。

要从 Git 中的文件创建笔记本,请参阅 从 Git 存储库中的文件创建笔记本

复制现有笔记本

您可以复制现有的 Snowflake Notebooks。例如,如果您想在不改变原始笔记本版本的情况下测试一些代码更改,复制笔记本可能会很有用。

当您复制笔记本时,复制的笔记本将与原始笔记本具有相同的角色和仓库,并且包含在与原始笔记本相同的数据库和架构中。因此,您无法复制笔记本以将其移动到不同的数据库和架构,或更改所有权。

要复制笔记本,请完成以下步骤:

  1. 登录 Snowsight

  2. 选择 Projects » Notebooks

  3. 打开您想要复制的笔记本。

  4. 选择垂直省略号 工作表的更多操作 菜单,然后选择 Duplicate

  5. (可选)输入重复笔记本的名称,然后选择 Duplicate

  6. 在确认对话框中,选择 Close 返回到原始笔记本,或选择 Open notebook 打开重复的笔记本。

打开现有笔记本

要打开现有笔记本,请按照以下步骤操作:

  1. 登录 Snowsight。

  2. 选择 Notebooks

    备注

    最近使用的笔记本也显示在 Snowsight 中。在 下,选择 Notebooks

  3. 查看笔记本列表。

    您可以查看由您当前就角色拥有的所有笔记本,或者由您当前角色继承的角色拥有的所有笔记本。每个笔记本都会显示以下信息:

    • Title:笔记本的标题

    • Viewed:上次查看笔记本的时间

    • Updated:上次执行笔记本的时间

    • Environment:笔记本的运行时环境(容器运行时或仓库运行时)

    • Location:笔记本的数据库和架构位置

    • Owner:笔记本的所有者

  4. 选择并打开一个笔记本以进行编辑。

    有关编辑笔记本的详细信息,请参阅 在 Snowflake Notebooks 中开发和运行代码

当打开一个笔记本时,您可以看到上次运行笔记本中任何单元格时的缓存结果。该笔记本默认处于 Not connected 状态,但如果您选择该状态或运行任何单元格,您的笔记本将连接到您的虚拟仓库。

语言: 中文