力图¶
使用 plot_force()
函数创建可视化效果,显示每个特征如何为模型的预测做出贡献。特征的贡献由箭头表示,该箭头指示模型的预测值高于或低于基准值。

力图中的箭头大小对应于其影响的程度。在上图中,feature_5
具有最大的正面影响,将预测推高,而 feature_4
具有最大的负面影响,将预测拉低。最终预测值约为 4。
必填实参¶
实参 |
描述 |
---|---|
|
包含特定实例 SHAP 值的 Pandas 系列或 Snowpark Row。SHAP 值表示每个特征对预测的贡献程度。 |
|
包含同一实例的实际特征值的 Pandas 系列或 Snowpark Row。这些值与其贡献并排显示。 |
可选实参¶
实参 |
描述 |
---|---|
|
代表模型平均预测的基准值。默认为 0.0,但通常应设置为模型的平均预测值。 |
|
控制图大小的元组,形式为 (宽度, 高度)。如未指定,则使用默认大小 (1400, 500)。 |
|
介于 0 和 1 之间的浮点数,用于筛选要显示的特征。仅显示绝对 SHAP 值大于此阈值(占 SHAP 总绝对值的百分比)的特征。默认为 0.05 (5%)。 |
该函数返回一个图表,可视化以下项目:
模型的预测,用作起点
正面贡献(将预测推高),显示为红色
负面贡献(将预测拉低),显示为蓝色
特征名称、特征值和影响值,显示为注释
该可视化图表有助于理解以下数据点:
哪些特征对特定预测的影响最大
各特征分别是将预测推高还是降低
各特征的贡献程度
这些特征如何相互组合,得出最终的预测
备注
如果没有特征满足贡献阈值,或者提供的阈值无效(并非介于 0 和 1 之间),则该函数将引发 SnowflakeMLException
。