力图

使用 plot_force() 函数创建可视化效果,显示每个特征如何为模型的预测做出贡献。特征的贡献由箭头表示,该箭头指示模型的预测值高于或低于基准值。

显示特征对模型预测的贡献的力图示例

力图中的箭头大小对应于其影响的程度。在上图中,feature_5 具有最大的正面影响,将预测推高,而 feature_4 具有最大的负面影响,将预测拉低。最终预测值约为 4。

必填实参

实参

描述

shap_row

包含特定实例 SHAP 值的 Pandas 系列或 Snowpark Row。SHAP 值表示每个特征对预测的贡献程度。

features_row

包含同一实例的实际特征值的 Pandas 系列或 Snowpark Row。这些值与其贡献并排显示。

可选实参

实参

描述

base_value

代表模型平均预测的基准值。默认为 0.0,但通常应设置为模型的平均预测值。

figsize

控制图大小的元组,形式为 (宽度, 高度)。如未指定,则使用默认大小 (1400, 500)。

contribution_threshold

介于 0 和 1 之间的浮点数,用于筛选要显示的特征。仅显示绝对 SHAP 值大于此阈值(占 SHAP 总绝对值的百分比)的特征。默认为 0.05 (5%)。

该函数返回一个图表,可视化以下项目:

  1. 模型的预测,用作起点

  2. 正面贡献(将预测推高),显示为红色

  3. 负面贡献(将预测拉低),显示为蓝色

  4. 特征名称、特征值和影响值,显示为注释

该可视化图表有助于理解以下数据点:

  • 哪些特征对特定预测的影响最大

  • 各特征分别是将预测推高还是降低

  • 各特征的贡献程度

  • 这些特征如何相互组合,得出最终的预测

备注

如果没有特征满足贡献阈值,或者提供的阈值无效(并非介于 0 和 1 之间),则该函数将引发 SnowflakeMLException

语言: 中文