Snowpark Migration Accelerator: 通用清单

当 Snowpark Migration Accelerator (SMA) 分析您的代码时,它会执行两种类型的扫描:

  1. 特定语言扫描,用于分析源编程语言中的代码

  2. 一种通用扫描,用于收集有关代码库中文件和关键字的基本信息

您可以在 SMA 清单 部分找到有关特定语言扫描结果的详细信息。本页描述了通用扫描收集的信息。

请注意,尽管某些文件具有 .pam 扩展名,但它们实际上是逗号分隔的文件,类似于 .csv 文件。您可能会注意到这些文件中有重复的条目,因为为了便于进行各种类型的分析,数据采用了不同的组织方式。

文件摘要

files.pam 包含一个清单,其中列出了在工具执行期间处理的所有文件。它会记录每个文件的文件类型和大小。该文件包含的信息与 SMA 清单部分中描述的 files.csv 相同。

通用文件清单

FilesInventory.csv 文件包含每个源文件的分类详细信息和行数。

  • 文件名:根输入目录中文件的完整路径和名称

  • Extension:文件类型扩展名(例如,.java、.py、.sql)

  • Technology:根据文件扩展名识别的编程语言或技术

  • Status:对于已识别的文件,始终显示“OK”(未识别的文件不会列出)

  • isBinary:指示文件是二进制 (TRUE)、文本 (FALSE) 还是无法识别 (UNKNOWN)

  • Bytes:文件大小,以字节为单位

  • ContentType:将每行归类为:

    • Code:编程指令

    • Comment:文档或备注

    • Blank:空行

    • Other:无法识别的内容

  • ContentLines:文件中的代码行总数

  • CommentLines:文件中的注释行总数

  • BlankLines:文件中的空行总数

关键字字数

KeywordCounts.csv 文件按技术类型提供了在每个文件中检测到的所有关键字的完整列表。该分析包括来自我们的通用扫描器可以处理的任何编程语言的关键字,而不仅仅是 Snowpark Migration Accelerator (SMA) 官方支持的源语言。

  • FileId:关键字所在的文件路径

  • Technology:源文件中使用的原始技术

  • Keyword:找到的特定关键字(示例:from、import、DataFrame)

  • Count:关键字在每行中出现的次数

行清单

line_counts.pam 文件会分析扫描文件中的每一行,并将它们归类为代码、注释或空行。它还提供了每个类别的总数。

  • FileId:正在分析的文件的名称

  • LineKind:文件中每行的类别(可以是代码、注释或空白)

  • Count:FileId 和 LineKind 每种组合的总行数

工具执行清单

tool_execution.pam 文件包含有关当前 SMA 工具执行的基本信息。该文件与本文档的 SMA 清单部分中描述的 tool_execution.csv 文件 相同。

字数

word_counts.pam 文件显示每个关键字在扫描的代码库中的所有文件中出现的次数。

  • FileId:关键字所在的文件位置和相对路径

  • Keyword:标识为关键字的特定文本(示例:from、import、DataFrame)

  • Count:关键字在单行代码中出现的次数

语言: 中文