工作区中的 Snowflake 笔记本

备注

Notebooks in Workspaces 将取代 Legacy Notebooks 体验。从 2026 年 3 月开始,Snowflake 将逐步推出将 Legacy Notebooks 导入工作区的功能。有关两种体验的比较信息,请参阅 旧版和新版笔记本之间的主要区别

概述

工作区中的全新 Snowflake 笔记本体验提供了增强的性能、提高的开发人员工作效率和 Jupyter 兼容性。工作区环境支持轻松的文件管理,允许您迭代单个笔记本和项目文件。创建文件夹、上传文件和整理笔记本。笔记本文件在工作区中以标签的形式打开,可以进行编辑和执行。

这一新产品包括:

  • 熟悉的 Jupyter 体验 – 支持 Jupyter Notebook 环境,可直接访问受治理的 Snowflake 数据。

  • 增强的 IDE 功能 – 编辑工具、文件管理和终端访问,以提高工作效率。

  • 功能强大,适用于 AI/ML – 在预构建的容器环境中运行,优化了可扩展的 AI/ML 开发,并提供对 CPUs 和 GPUs 完全托管的访问。

  • 受控协作 – 允许多个用户在同一工作区中协作,使用基于角色的访问控制和版本历史记录,通过 Git 集成工作区共享工作区 实现。

  • 计划和编排 – 使用原生计划程序或将笔记本合并到生产管道的编排脚本中。

../../../_images/notebooks-in-workspaces.png

机器学习 (ML) 工作流程优势

工作区中的笔记本提供了 ML 工作流程的两个主要功能:

  • 端到端工作流程 – 该平台使用户能够在单一的 Jupyter Notebook 环境中整合整个 ML 生命周期,从源数据访问到模型推理。此环境与基础数据平台集成,使其能够继承数据和代码资产的现有治理和安全控制。

  • 可扩展模型开发架构 – 该架构通过提供开源软件 (OSS) 模型开发能力,支持可扩展模型的开发。用户可以通过指定的 CPU 或 GPU 计算池访问分布式数据加载和训练。这种设计简化了 ML 通过抽象化手动配置分布式计算资源的需求来进行基础设施管理。

有关 Snowflake ML,请参阅 Snowflake ML:端到端机器学习

开始使用

备注

这些快速入门仅作为示例显示。按照示例操作可能需要对非 Snowflake 拥有或提供的第三方数据、产品或服务具有额外权利。Snowflake 不保证这些示例的准确性,也不将其纳入任何服务等级协议的覆盖范围。

  • 观看 介绍视频 (link removed),概览 Notebooks in Workspaces。

  • 按照 快速入门 教程,了解如何在 Snowflake ML 中使用 scikit-learn 和 Pandas 加速主题建模。

  • 探索 首个机器学习项目笔记本系列 (https://github.com/Snowflake-Labs/snowflake-demo-notebooks/tree/main/First_Machine_Learning_Project/Jupyter),该系列涵盖数据准备、探索性数据分析、模型训练和实验跟踪。

  • 按照 在 Snowflake 中构建端到端 ML 工作流程 指南,完成从数据准备到模型部署的完整机器学习工作流程。

  • 按照 使用 Snowflake 笔记本进行数据工程 快速入门教程(附有 GitHub 上的配套代码 (https://github.com/Snowflake-Labs/sfguide-data-engineering-with-notebooks)),了解如何使用 Notebooks in Workspaces 构建生产数据工程管道。

  • 查看 医疗保健 ML 示例:使用 XGBoost 进行乳腺癌分类,该示例演示了如何在 Snowflake 中构建分类模型。