是的,AutoML 系统可以支持自定义指标,但这种支持的程度取决于所使用的具体平台或框架。 AutoML 工具旨在自动化模型选择、超参数调整和特征工程等任务,但许多工具还允许开发人员定义根据项目需求量身定制的自定义评估指标。这种灵活性至关重要,因为现实世界的问题通常需要超出标准指标(如准确率或 F1 分数)的指标。例如,医疗诊断模型可能优先考虑最小化假阴性而不是其他错误,因此需要自定义指标来更严厉地惩罚漏诊。
像 Google 的 AutoML Tables、H2O Driverless AI 和 Auto-sklearn 或 TPOT 等开源库之类的平台提供了集成自定义指标的机制。例如,在 Google 的 AutoML 中,您可以通过编写一个 Python 函数来定义自定义指标,该函数根据预测值和实际值计算指标,然后将其传递给训练过程。同样,H2O 的 Driverless AI 允许用户在实验设置期间指定自定义评分函数。这些工具通常要求指标遵循特定格式,例如接受真实标签和预测作为输入并返回标量值的函数。这确保了与 AutoML 系统的优化管道的兼容性,该管道使用该指标来比较和选择最佳模型。
但是,存在局限性和注意事项。首先,并非所有 AutoML 平台都支持自定义指标——有些平台将用户限制为预定义选项。其次,自定义指标必须与工具的底层优化过程保持一致。例如,如果 AutoML 系统使用基于梯度的优化,则该指标可能需要是可微分的,这对于高度专业化的指标而言并非总是可行的。此外,开发人员必须确保自定义指标在计算上是高效的,因为复杂的计算可能会减慢自动训练过程。尽管存在这些注意事项,但在 AutoML 中定义自定义指标的能力使团队能够使模型评估与业务目标保持一致,使其成为特定领域应用程序的宝贵功能。