Snowpark Migration Accelerator：词汇表¶

The Snowpark Migration Accelerator (SMA) uses some technical terms that might be unfamiliar. Refer to the glossary page to learn more about these terms.

Snowpark Migration Accelerator (SMA)¶

本软件文档介绍如何自动将用 Scala 或 Python 编写的 Spark API 代码转换为等效的 Snowflake Snowpark 代码。转换过程是安全有保障，可以保持原始代码的功能。

The Snowpark Migration Accelerator (SMA) was previously known as SnowConvert and SnowConvert for Spark. SnowConvert (SC) continues to be available as a tool for SQL conversions.

就绪度分数¶

就绪度分数可以帮助您了解代码迁移到 Snowpark 的准备情况。它计算可以转换为 Snowpark API 的 Spark API 引用的百分比。例如，如果可以转换 3748 个 Spark API 引用中的 3413 个，则就绪度分数将为 91%。

但是，值得注意的是，这个分数：

仅考虑 Spark API 引用
不评估第三方库
应用作初步评估，而非最终决定因素

虽然分数越高表示与 Snowpark 的兼容性越好，但在继续迁移之前，您还应该评估其他因素，例如第三方库依赖关系。

Spark 引用类别¶

Snowpark Migration Accelerator (SMA) 根据 Spark 组件与 Snowpark 功能的映射方式对它们进行分类。对于每个 Spark 引用，SMA 都提供：

如何转化为 Snowpark 的分类
详细描述
示例代码
有关自动转换功能的信息
有关 Snowpark 支持的详细信息

You can find the complete reference guide on this page.

SnowConvert 认证工具¶

SnowConvert for Spark 的评估模式会分析您的代码库，以自动检测和识别 Apache Spark Python 代码的所有实例。

文件清单¶

在工具的输入目录中找到的所有文件的完整列表，不分文件类型。该清单提供了按文件类型组织的详细分类，包括：

原技术或平台
代码行数
注释行数
源文件大小

关键字字数¶

按技术类型排列的关键字出现次数摘要。例如，在分析包含 PySpark 代码的 .py 文件时，系统会跟踪并计算每个 PySpark 关键字。该报告显示为每个文件扩展名找到的关键字总数。

Spark 引用清单¶

分析您的代码后，您将收到 Python 代码中所有 Spark API 引用的完整列表。

就绪度分数¶

Spark 代码引用将帮助确定有多少代码库可以自动转换。

转换分数¶

转换分数的计算方法是将自动转换的 Spark 操作数除以代码中检测到的 Spark 引用总数。

转换规则¶

定义 SnowConvert 如何将源代码转换为所需目标代码格式的规则。

解析¶

解析阶段是 SnowConvert 分析源代码并创建内部数据结构的第一步。然后使用此结构在迁移过程中应用转换规则。

Snowpark Migration Accelerator： 词汇表¶

Snowpark Migration Accelerator (SMA)¶

就绪度分数¶

Spark 引用类别¶

SnowConvert 认证工具¶

文件清单¶

关键字字数¶

Spark 引用清单¶

就绪度分数¶

转换分数¶

转换规则¶

解析¶

Snowpark Migration Accelerator：词汇表¶