FLAML自定义评估指标的正确使用方法解析

2025-06-15 05:00:27作者：魏献源Searcher

引言

在机器学习自动化工具FLAML中，评估指标的选择对于模型优化至关重要。虽然FLAML提供了丰富的内置评估指标，但在实际业务场景中，我们经常需要根据特定需求定义自定义评估指标。本文将详细介绍如何在FLAML中正确使用自定义评估指标，特别是针对回归任务中常用的调整R²和加权平均绝对百分比误差(WMAPE)的实现方法。

自定义评估指标的基本概念

FLAML允许用户通过定义Python函数来创建完全自定义的评估指标。与内置指标不同，自定义指标需要以函数对象的形式直接传递给FLAML，而不是通过字符串名称引用。这种设计提供了极大的灵活性，但同时也容易导致使用上的误区。

常见错误模式

许多用户在使用FLAML自定义指标时容易犯的一个典型错误是：将自定义指标的名称以字符串形式传递给metric参数，就像使用内置指标那样。例如：

automl_settings = {
    "metric": "custom_adjusted_r2",  # 错误用法
    "task": "regression",
    # 其他参数...
}

这种用法会导致FLAML无法识别自定义指标，进而引发各种预测和评估错误。

正确实现方法

1. 自定义调整R²指标

调整R²考虑了模型使用的特征数量，可以防止过拟合。以下是正确实现方式：

from sklearn.metrics import r2_score
import numpy as np

def custom_adjusted_r2(
    X_val, Y_val, estimator, labels, 
    X_train, Y_train, weight_val=None, 
    weight_train=None, config=None, 
    groups_val=None, groups_train=None
):
    Y_pred = estimator.predict(X_val)
    r2 = r2_score(Y_val, Y_pred, sample_weight=weight_val) if weight_val else r2_score(Y_val, Y_pred)
    n = len(Y_val)
    p = X_val.shape[1]
    
    adjusted_r2 = r2 if n - p - 1 <= 0 else 1 - ((1 - r2) * (n - 1) / (n - p - 1))
    return 1 - adjusted_r2, {"r2": r2, "adjusted_r2": adjusted_r2}

2. 自定义WMAPE指标

加权平均绝对百分比误差(WMAPE)是业务场景中常用的指标：

def custom_wmape(
    X_val, Y_val, estimator, labels,
    X_train, Y_train, weight_val=None,
    weight_train=None, config=None,
    groups_val=None, groups_train=None
):
    Y_pred = estimator.predict(X_val)
    if weight_val is not None:
        num = np.sum(weight_val * np.abs(Y_val - Y_pred))
        den = np.sum(weight_val * np.abs(Y_val))
    else:
        num = np.sum(np.abs(Y_val - Y_pred))
        den = np.sum(np.abs(Y_val))
    wmape = num / den if den != 0 else float('inf')
    return wmape, {"wmape": wmape}

在FLAML中使用自定义指标

定义好自定义函数后，需要直接将函数对象传递给FLAML：

automl = AutoML()
automl_settings = {
    "metric": custom_adjusted_r2,  # 直接传递函数对象
    "task": "regression",
    "eval_method": "cv",
    "n_splits": 5,
    "time_budget": 300
}

automl.fit(X_train=X_train, y_train=y_train, **automl_settings)