Snowpark Migration Accelerator: 词汇表

Snowpark Migration Accelerator (SMA) 使用了一些可能不熟悉的技术术语。请参阅我们的词汇表页面,了解有关这些术语的更多信息。

Snowpark Migration Accelerator (SMA)

本软件文档介绍如何自动将用 Scala 或 Python 编写的 Spark API 代码转换为等效的 Snowflake Snowpark 代码。转换过程是安全有保障,可以保持原始代码的功能。

Snowpark Migration Accelerator (SMA) 以前被称为 SnowConvert 和 SnowConvert for Spark。请注意,SnowConvert(SC) 仍然可用作 SQL 转换工具。

就绪度分数

就绪度分数可以帮助您了解代码迁移到 Snowpark 的准备情况。它计算可以转换为 Snowpark API 的 Spark API 引用的百分比。例如,如果可以转换 3748 个 Spark API 引用中的 3413 个,则就绪度分数将为 91%。

但是,值得注意的是,这个分数:

  • 仅考虑 Spark API 引用

  • 不评估第三方库

  • 应用作初步评估,而非最终决定因素

虽然分数越高表示与 Snowpark 的兼容性越好,但在继续迁移之前,您还应该评估其他因素,例如第三方库依赖关系。

Spark 引用类别

Snowpark Migration Accelerator (SMA) 根据 Spark 组件与 Snowpark 功能的映射方式对它们进行分类。对于每个 Spark 引用,SMA 都提供:

  • 如何转化为 Snowpark 的分类

  • 详细描述

  • 示例代码

  • 有关自动转换功能的信息

  • 有关 Snowpark 支持的详细信息

您可以 在本页 找到完整的引用指南。

SnowConvert 认证工具

SnowConvert for Spark 的评估模式会分析您的代码库,以自动检测和识别 Apache Spark Python 代码的所有实例。

文件清单

在工具的输入目录中找到的所有文件的完整列表,不分文件类型。该清单提供了按文件类型组织的详细分类,包括:

  • 原技术或平台

  • 代码行数

  • 注释行数

  • 源文件大小

关键字字数

按技术类型排列的关键字出现次数摘要。例如,在分析包含 PySpark 代码的 .py 文件时,系统会跟踪并计算每个 PySpark 关键字。该报告显示为每个文件扩展名找到的关键字总数。

Spark 引用清单

分析您的代码后,您将收到 Python 代码中所有 Spark API 引用的完整列表。

就绪度分数

Spark 代码引用将帮助确定有多少代码库可以自动转换。

转换分数

转换分数的计算方法是将自动转换的 Spark 操作数除以代码中检测到的 Spark 引用总数。

转换规则

定义 SnowConvert 如何将源代码转换为所需目标代码格式的规则。

解析

解析阶段是 SnowConvert 分析源代码并创建内部数据结构的第一步。然后使用此结构在迁移过程中应用转换规则。

语言: 中文