Snowpark Migration Accelerator: SC Spark Python 版本说明¶
2.14.0¶
2023-10-24 \ \ 已添加\ \ 为文件名添加精简 ID,并在日志中使用。
更改
重构 TrialMode 的输出文件夹层次结构。
当分数达到 90 分或以上时,在“评估”模式下本地生成报告。
如果是 Snowflake 用户,则在“评估”模式下本地生成报告。
以 .csv 文件格式创建清单。
将清单移至“报告”文件夹。
¶
2.13.0¶
2023-10-19\
已添加\
添加一个标志以启用更多日志记录消息。
添加一个标志以禁用转换的执行。
为 Scala 符号表解析添加超时机制。
为 Scala 解析阶段添加超时机制。
在 Scala 的解析阶段添加进度日志消息。
已更改\
调整报告(HTML 和 docx):重命名就绪分数,更新附录和导入调用表。
将
AssessmentMode从 8.1.6 升级到 9.0.4将
Common.AssessmentModel从 3.1.12 升级到 3.1.14添加锁定以避免竞态条件
已修复\
修复评估模式和转换模式之间 SparkReferences 数量不一致的问题。
修复导致 .sql 文件无法识别为支持文件的问题。
修复反斜杠位于 AtomElement 和 BracedSlices 之间时的解析错误。
修复解析包含大量嵌套表达式的代码时耗时过长的问题。
2.12.0¶
2023-10-13
已添加
添加试用模式支持。
更改
将
Snowflake.SnowConvert.Python从 1.1.79 升级到 1.1.80添加 ResolveType 的变体,以避免在某些情况下出现堆栈溢出。
已修复
修复解析 FullName 时导致堆栈溢出的情况。
2.11.0¶
已添加
在 Python 上添加对 Snowpark API 版本 1.7.0 的支持。
在 Python 上添加对 Snowpark API 版本 1.6.1 的支持。
添加了新的替代方案
添加了四 (4) 个新映射
更改
更新 Scala 集成测试验证。
缩短 Scala 集成测试时间。
更新内部代码中剩余的程序集名称引用。
更新源文件标题以符合公司准则。
已修复
通过向清单和报告添加 SessionId 和 ExecutionId,使用相同的 ExecutionId 修复多个执行问题。
使用 storage.lck 文件修复失败的 CopyOtherFiles 任务。
修复某些值为空时生成 .HTML 报告的问题。
2.09.0¶
2023-10-03
已添加
添加 FilesInventory.pam
添加了四 (4) 个新映射
更改
更改程序集名称。
将
Snowflake.SnowConvert.Python从 1.1.70 升级到 1.1.79在三种不同的规则中添加反斜杠来解决解析错误。
添加新的 Spark 引用符号。
支持两 (2) 个新解决方案。
支持 .sql DBX 笔记本中的空命令。
提高 StopIfDedent 函数的稳健性。
已修复
修复反斜杠场景中使用参数和逗号的解析错误。
修复圆括号之间的表达式符号解析问题。
修复 .sql DBX 笔记本中使用空命令的解析错误。
修复空括号符号解析问题。
修复收集 SQL 语句清单时出现的正则表达式超时错误。
修复与混合缩进相关的解析错误。
修复发现解析错误时的假崩溃消息。
修复评估模式和转换模式之间 SparkReferences 数量不一致的问题。
2.8.0¶
2023-09-27
已添加
在 Python 上添加对 Snowpark API 版本 1.5.1 的支持。
添加对 Python 3.10.10 语法的支持。
在清单中添加 CellId 列(适用于笔记本、Databricks 和 Jupyter)。
添加四 (4) 个新映射
更改
将
Mobilize.Python从 1.1.64 升级到 1.1.70添加对 Python 3.10.10 语法的支持。
添加三 (3) 个新的反斜杠场景来解决解析错误。
向某些 Pandas 符号添加明确的返回类型以避免加载错误。
已修复
修复在方括号、冒号和参数场景中使用反斜杠时出现的解析错误。
修复加载 Pandas 符号时出现的错误。
2.7.0¶
2023-09-20\
已添加\
在 Python 上添加对 Snowpark API 版本 1.5.0 的支持。
添加了 3 个新映射
已更改\
避免处理隐藏文件
将 `Mobilize.SparkCommon.Utils` 从 1.3.188 升级到 1.3.189
将 `Mobilize.Common.Utils` 从 3.2.0 升级到 3.2.2
已修复\
修复 PackageVersionInventory 收集阶段卡住的问题。
修复在使用 DBC 文件时,详细报告中 Spark 使用摘要表的百分比显示错误的问题。
修复详细报告中的文件大小表显示为空或根本不显示的问题。
2.6.0¶
2023-09-12\
已添加\
向 SQL 语句清单添加对 %SQL 单元格(来自笔记本)的支持。
已更改\
将 `Mobilize.Python` 从 1.1.62 升级到 1.1.64
添加对 magic sql 的支持。
当推断类型为 `None` 时,避免更新函数参数类型。
已修复\
修复导致特定文件无限加载符号的问题。
修复无法生成 GenericScanner 文件的问题。
安全\
在 Python 转换测试中保护测试密码。
¶
2.5.0¶
2023-09-05
已添加
添加笔记本尺寸清单。
添加 Snowflake.SparkCommon.MappingLoader 项目(使用新版 Snowflake.SnowMapGrammar)。
更改
将 Mobilize.Python 从 1.1.59 升级到 1.1.62
在 Python 符号解析的 GetSymbol 方法中添加超时机制。
将 Mobilize.SparkCommon.Utils 从 1.3.186 升级到 1.3.187
更新 Mobilize.SparkCommon.Utils.FilesHelper.CopyFilesRecursively 方法以处理隐藏的文件。
已修复
修复运行后无法收到电子邮件的问题(通过避免默认日志记录调试消息来减小日志文件的大小)。
已移除
移除 Mobilize.SparkCommon.TransformationCore 项目(使用旧版 Mobilize.MapGrammar)。
2.4.0¶
2023-08-28
已添加
添加 NotebookCells 清单。
收集 Scala 和 Python 的 DataFrameReader.option 和 DataFrameWriter.option 的实参值。
添加 2 个新的映射以及更完善的别名类型信息集合
提供其他参数时对输出文件进行加密。
重新启用 SQLStatements 清单。
重新启用收集器的并行化。
更改
更新详细报告(docx 和 html)的“文件类型摘要”部分。(SCT-3867)
更新 2 个映射
将 Mobilize.SparkCommon.Utils 从 1.3.181 升级到 1.3.186。
改进对 CSV 文件排序的支持。
将 Mobilize.Common.Utils 从 3.1.6 升级到 3.2.0。
改进对 CSV 文件排序的支持。
将 Mobilize.Common.Utils 从 3.1.6 升级到 3.2.0。
更新 NuGet 包版本。
重构负载映射任务。
重构 SparkCommon Utils 项目参考。
分组解决方案项目。
合并 Scala 集成测试 JupyterTest、InventoryTests 和 TransformationTest。
已修复
修复在收集 SQL 语句清单项目时导致 Python 转换工具卡住的问题。
修复输出中缺失的 GenericScanner 文件。
修复迁移的 DBC 文件无法加载到 Databricks 中的问题。
修复工具过程结束时的错误。
已移除
移除 InventoryStorageTemp。
移除多余的 StyleCop.Analyzers 项目参考。
\
2.2.001¶
2023-07-19
已添加
添加六 (6) 个新映射
更改
Assessment Model 从 3.1.10 更新到 3.1.11
已修复
修复 Databricks 处理无法在“评估”模式下运行的问题
安全
为 HTML 链接添加了子资源完整性
2.1.161¶
2023-07-06
已修复
修复和启用 Scala Spark 功能测试
2.1.160¶
2023-07-05
更改
Assessment Model 从 3.1.9 更新到 3.1.10
2.1.159¶
2023-07-05
更改
Assessment Model 从 3.1.7 更新到 3.1.9
2.1.158¶
2023-07-05
已添加
通过改进任务中异常的处理来增强工具稳定性
2.1.157¶
2023-07-05
\ 已更改
Spark Common 从 1.3.178 更新到 1.3.181
2.1.155¶
2023-07-05
更改
Common Build 从 2.0.2 更新到 3.0.4。
对在 MacOs 中构建解决方案作出改进
2.1.148¶
2023-07-04
更改
Spark Common 从 1.3.177 更新到 1.3.178
Common Utils 从 4.0.0-alpha.DevOps.9 更新到 3.1.6
2.1.147¶
2023-07-03
安全
移除 `Spark Common` 项目中未经许可的包参考。
2.1.146¶
2023-07-03
更改
将 `coverlet.collector` 从 3.2.0 升级到 6.0.0
将 `FluentAssertions` 从 6.9.0 升级到 6.11.0
将 `Scriban.Signed` 从 5.5.2 升级到 5.7.0
将 `DocumentFormat.OpenXml` 从 2.19.0 升级到 2.20.0
\ 安全
移除 `SparkCommon` 项目中未经许可的包参考。
2.1.145¶
2023-06-28
更改
`Mobilize.Python` 从 1.1.49 更新到 1.1.50
修复不解析单个单元格时的 Databricks 笔记本整个文件解析问题
2.1.144¶
2023-06-27
已修复
修复 MacOS 上的 .dbc 文件提取问题
2.1.143¶
2023-06-26
已修复
修复由于不同数据格式而导致的测试错误。
2.1.142¶
2023-06-26
更改
重构清单存储。
2.1.141¶
2023-06-23
更改
`Mobilize.Python` 从 1.1.46 更新到 1.1.49
在解析符号时检测和停止递归循环
修复涉及 \_\_init\_\_.py 文件的 StackOverflow 异常
用反斜杠修复 PyArgExpr 节点
2.1.140¶
2023-06-22
更改
`Mobilize.Python` 从 1.1.44 更新到 1.1.46
用反斜杠修复 PyTerm 节点
2.1.138¶
2023-06-22
更改
Spark Common 从 1.3.176 更新到 1.3.177
已修复
修复构建 Scala 代码处理器的问题。
2.1.137¶
2023-06-22
安全
功能测试中的安全凭证。
移除未经许可的包引用。
2.1.136¶
2023-06-21
更改
`Snowflake.Data` 从 2.0.15 更新到 2.0.25
Spark Common 从 1.3.175 更新到 1.3.176
安全
升级功能测试中的引用。
2.1.135¶
2023-06-21
已添加
添加 Python 和 Scala 代码处理器工具支持的 .dbc 扩展名。
为 Contracts 项目添加测试。
安全
移除 `SparkCommon.Contracts.Test` 中未经许可的包参考。
2.1.132¶
2023-06-21
已移除
在评估模式下从 IOFiles 清单中移除 `Supported` 列。
2.1.131¶
2023-06-20
已修复
修复 Mac 上的测试。
2.1.130¶
2023-06-19
更改
将 SparkCommon 存储库与该存储库合并。
2.1.126¶
2023-06-16
已修复
修复构建存储库的问题。
2.1.124¶
2023-06-15
已修复
修复构建存储库的问题。
2.1.123¶
2023-06-15
更改
`Mobilize.Scala` 从 0.2.34 更新到 0.2.37
修复涉及带有下划线和限制的泛型类型的解析错误
修复涉及带引号和插值的表达式的解析错误
安全
移除不安全的包引用。
2.1.121¶
2023-06-15
安全
移除凭证文件。
2.1.120¶
2023-06-15
更改
Scala 和 Python 的版本配置都略有变更。
1.0.877¶
2023 年 4 月 26 日
Python 1.1.25
PythonSnowConvert Core 2.01.090
SparkCommon 1.3.151
已添加
添加了对 Snowpark 1.3.0 的支持。
4 个新映射
EWI SPRKPY1048 已弃用
添加了对以下内容的转换
DataFrameReader 链
SparkSession.sparkContext
在详细报告的“问题摘要”表中添加了 Severity 列
改进
改进了 Spark 使用情况清单文件的名称
改进了当未找到 Spark 引用时,就绪分数显示值
已修复
修复了按钮 URLs
修复了本地和遥测中 Spark 使用情况清单的不一致问题
修复了详细报告的 Spark 使用情况摘要表中的 RDD 指标
修复了报告中零和短划线符号的不一致问题
1.0.826¶
2023 年 3 月 29 日
Python 1.1.25
PythonSnowConvert Core 2.01.068
SparkCommon 1.3.131
已添加
添加了对转换 DBC 文件的支持
改进
添加了 DataFrameReader.format 和 DataFrameReader.load 的转换
已修复
修复了转置的 SnowConvert/Snowpark 版本值
1.0.725¶
2023 年 2 月 15 日
Python 1.1.11
PythonSnowConvert Core 2.01.022
SparkCommon 1.3.113
已添加
添加了对 Databricks 存档文件(.dbc 扩展名)的支持
添加了对 Databricks 笔记本文件(.python 扩展名)的支持
添加了 Spark 使用情况识别过程的并行性
添加了对 SnowPark API 版本 1.1.0 的支持
添加了映射元素:
12 个直接映射
2 个转换(使用辅助程序进行)
改进
改进了 SPRKPY1038 EWI 消息
使用属性访问权限改进了列转换中 EWIs 的注册
改进了本地报告名称
1.0.691¶
2023 年 2 月 1 日
Python 1.1.3
PythonSnowConvert Core 2.1.4
SparkCommon 1.3.105
已添加
添加了 Net6 兼容性(内部)
添加了 issues.csv 报告
在详细报告中添加了尺寸表
添加了对全局变量声明的支持
添加了对继承符号识别的支持
添加了对使用属性访问权限访问列的支持
在遥测中添加了所使用的映射版本
在 GenericScanner 中添加了对 Jupyter 笔记本的支持
添加了映射元素:
1 个直接映射
1 个转换(使用辅助程序进行)
6 种替代方案
5 个不支持的识别
改进
改进了报告、清单和遥测中的工具版本格式
改进了本地和远程 HTML 报告的同步
改进了 HTML 详细报告与 DOCX 详细报告的同步
改进了按 EWI 代码分组的问题表
改进了按包分组的导入表
改进了注释输出代码
改进了 UI 进度阶段标题
错误修复
修复了复杂语句的 EWI 消息位置
修复了取消执行时的 UI 措辞
更正了报告中的拼写错误
1.0.594¶
2022 年 12 月 28 日
Python 1.0.457
PythonSnowConvert Core 2.0.280
已添加
在 Generic Scanner 中添加了对 Jupyter 笔记本的支持
在报告中添加了转化百分比
在导入使用情况清单中添加了“ElementPackage”列
添加了 1 个直接映射
添加了 4 个辅助程序
添加了 2 种替代方案
为详细报告添加了细微的视觉改进
改进
将 1 个映射从重命名改进为直接
改进了详细报告中问题表的排序
错误
修复了详细报告中问题表的列大小
修复了为 Column.contains 函数使用说明添加 EWI 注释时出现的错误
修复了 6 种在 Spark 使用情况清单中不匹配的映射状态
1.0.555¶
2022 年 12 月 21 日
Python 1.0.457
PythonSnowConvert Core 2.0.259
新功能
添加了 3 种新的替代方案
在详细报告描述中添加了误差幅度
改进
将 2 个映射从重命名改进为直接
改进了详细报告中问题表的排序
改进了详细报告中百分比的显示
改进了转换暂存区日志记录消息
错误
修复了 2 个映射
修复了不支持的元素的识别问题
1.0.515¶
2022 年 12 月 14 日
Python 1.0.457
PythonSnowConvert Core 2.0.241
新功能
支持“snowpark_extensions”
使用“snowpark_extensions”的 12 个转换
添加了 2 种替代方案
向表引用数据库添加了新的 Spark 引用,包括其状态。
客户信息已添加到详细报告中
改进
EWI SPRKPY1038 措辞改进
Spark 引用状态从 重命名 改进为 直接
错误修复
修复了映射中的一个错误
修复了一个损坏的 Spark 核心映射表
1.0.492¶
2022 年 12 月 7 日
Python 1.0.455
PythonSnowConvert Core 2.0.233
新功能
在就绪分数中添加了误差幅度
添加了 2 个新映射
为无法识别的 PySpark 元素添加了 EWI
改进
改进了详细报告中附录 A 的措辞
改进了工具转换数据库中未定义的 PySpark 元素的 EWI 消息
错误修复
修复了清单中的“alias”列名称
1.0.457¶
2022 年 12 月 1 日
Python 1.0.452
Python SnowConvert Core 2.0.217
新功能
添加了对 SnowPark API 版本 1.0.0 的支持
添加了 5 个新的替代方案文档
在遥测中添加了执行信息
为就绪分数添加了误差幅度
改进
提高了代码符号识别的准确性
记录消息时的评估步骤有所改进。
1.0.441¶
2022 年 11 月 23 日
Python 1.0.449
PythonSnowConvert Core 2.0.210
新功能
为未定义 PySpark 元素的输出代码添加了 EWI 注释
添加了对继承符号的支持
添加了 3 个新映射
添加了 1 种替代方案
改进
改进了所有文件都有错误时的就绪分数
改进了加载符号表时的错误消息
改进了对通用类型的处理
一种映射状态从重命名更改为直接
一种转换状态从替代方案更改为直接映射
错误修复
修复了 Markdown 转换问题
修复了 PySpark_Mappings_Core 表和工具之间的同步问题
1.0.425¶
2022 年 11 月 17 日
Python 1.0.445
PythonSnowConvert Core 2.0.203
改进
加载符号表的稳健性
错误修复
修复了关于 Spark 使用值的详细报告摘要表
修复了一些解析错误
修复了工具与 PySpark_Mappings_Core Snowflake DB 表之间的 EWI 代码同步问题
1.0.415¶
2022 年 11 月 15 日
Python 1.0.441
PythonSnowConvert Core 2.0.199
新功能
添加了加载符号表时检测到错误时的 EWI 记录
错误修复
修复了转换 Jupyter 笔记本文件时出现的新行问题
1.0.404¶
2022 年 11 月 11 日
Python 1.0.436
PythonSnowConvert Core 2.0.195
新功能
添加了对转换 Jupyter 笔记本文件的基本支持
添加了用于以清单形式追踪导入使用情况的值
改进详细报告(按支持类别和 Python 导入调用摘要分组的 Spark 使用情况)
添加了新映射
为“SparkSession.Builder.appName”添加了新的替代方案
在输出代码中添加了新的 EWIs 作为注释
添加了对将非 Python 文件复制到输出目录的支持
为 id 表达式添加了 PySpark 使用情况识别
添加了当符号表加载失败时的错误消息
改进
改进了导入映射
改进了类型提示映射
将重命名映射改进为直接映射
错误修复
解析错误
存在解析错误的文件的输出目录结构
修复了“pyspark.streaming”全名
修复了 CLI 崩溃问题
1.0.315¶
2022 年 10 月 21 日
Python 1.0.422
PythonSnowConvert Core 2.0.152
已添加
添加了类型推断
支持 5 种新映射
改进
详细报告
导入语句转换
转换文档
已修复
与项目 ID 日志相关的 EWIs
4 种 Pyspark 元素转换状态
1.0.280¶
2022 年 10 月 12 日
Python 1.0.417
PythonSnowConvert Core 2.0.135
已添加
新的转换
处理导入中使用的不受支持的 Pyspark 元素
日志记录消息方面的改进
1.0.271¶
2022 年 10 月 5 日
Python 1.0.417
PythonSnowConvert Core 2.0.132
已添加
符号识别的稳健性
改进类型解决方案
已修复
许可证更改后,设置按钮无法刷新
Python 版本参考中的文档链接
1.0.247¶
2022 年 9 月 27 日
Python 1.0.410
PythonSnowConvert Core 2.0.126
已添加
解析 Jupypter 笔记本文件时的稳健性
使用通用解析符号方面的改进
新的转换
已修复
报告中的 Python 文件总数
1.0.220¶
2022 年 9 月 15 日
Python 1.0.399
PythonSnowConvert Core 2.0.112
已添加
对导入的新支持
导入清单中的别名
已修复
macOS 文件清单中的行号错误
html 报告中已识别的使用情况表百分比
显示零个 PySpark 参考的认证工具
更新电子邮件模板中的联系信息
1.0.190¶
2022 年 9 月 6 日
Python 1.0.392
PythonSnowConvert Core 2.0.100
\
已添加
“SnowConvert Version”和“Snowpark Version”列到 SparkUsagesInventory
支持 pyspark 的更多功能
对速度分析的改进
\ 已修复
直接映射更新
1.0.148¶
2022 年 8 月 31 日
Python 1.0.381
PythonSnowConvert Core 2.0.71
已添加
支持 10 种新映射
检测到 17 种新的替代方案转换
支持识别 Jupyter 笔记本文件中的 PySpark 使用情况
“Automated”列和“Status”列已添加到 SparkReferenceInventory.csv
摘要和详细的 html 报告上传到 Snowflake
已修复
摘要和详细报告措辞修复
电子邮件模板措辞修复
1.0.107¶
2022 年 8 月 24 日
Python 1.0.380
PythonSnowConvert Core 2.0.30
已添加
支持 30 种新映射
识别 pyspark.streaming 和 pyspark.rdd 包
识别已导入符号方面的改进
电子邮件模板更新
在摘要报告中添加“版本信息”部分
在详细报告中添加“资源”部分
最终屏幕 UI 更改
对 SparkReferenceInventory 报告文件进行排序
已修复
设置按钮已移除
详细报告徽标更新
摘要和详细评估报告的百分比值精度
1.0.66¶
2022 年 8 月 17 日
Python 1.0.377
PythonSnowConvert Core 1.0.61
已添加
支持 136 种新映射
更新了共享电子表格中列为“已更正”的所有函数的支持状态
从 requirements.txt 文件中收集的信息
识别链式符号方面的改进
已修复
SparkReferenceInventory 报告中的行号
1.0.30¶
2022 年 8 月 9 日
Python 1.0.373
PythonSnowConvert Core 1.0.29
已添加
收集所有导入使用情况
识别 PySpark 使用情况方面的改进(不带模块的导入,带有星号的导入)
确定更多受支持的 DataFrame 函数
已修复
记录解析错误
0.1.172¶
2022 年 7 月 20 日
Python 0.1.172
已添加
命令行界面。
Python 代码认证工具功能。