AutoML 通过系统地测试算法、调整超参数以及根据预定义指标选择表现最佳的模型来自动化模型评估和选择过程。它通过三个核心步骤来实现这一目标:生成候选模型、评估其性能以及优化选择过程。这种方法减少了人工工作,同时确保模型满足性能、效率和复杂性要求。
对于评估,AutoML 通常使用交叉验证来可靠地评估模型性能。例如,5 折交叉验证将训练数据分成五个子集,在其中四个子集上训练模型,并在第五个子集上验证,对所有子集重复此过程。为每个折计算准确率(分类)或均方误差(回归)等指标,并取平均值以确定总体性能。AutoML 会根据这些指标测试多种算法——如逻辑回归、随机森林或梯度提升树。一些框架还结合了保留验证集来检测过拟合。例如,AutoML 可能会在训练后评估决策树在验证集上的性能,并将其与神经网络的结果进行比较,以确定哪种模型泛化能力更好。
模型选择结合了超参数调整和性能权衡。AutoML 使用搜索策略,如网格搜索(穷举测试预定义超参数组合)或贝叶斯优化(根据过去的结果预测有希望的超参数)来优化模型。例如,支持向量机 (SVM) 可以通过测试核类型(线性核与 RBF 核)和正则化参数进行调整。多目标优化平衡了推理速度和准确率等因素——对于实时应用,可能会选择轻量级模型如逻辑回归,而不是速度较慢但稍精确的神经网络。一些 AutoML 工具还采用集成方法,组合表现最佳的模型(例如,将随机森林的预测与 XGBoost 的预测叠加)以提高最终性能。选择的模型通常是验证得分最高的模型,以确保其对未见数据有良好的泛化能力。