是的,AutoML可以处理图像和文本等非结构化数据。 AutoML平台旨在自动化机器学习流程的各个部分,包括预处理、模型选择和超参数调整,即使对于非表格数据也是如此。 例如,Google的AutoML Vision和Azure的Custom Vision允许开发人员上传图像数据集,自动训练用于诸如对象检测或分类之类的任务的模型,并在无需编写复杂代码的情况下部署它们。 类似地,诸如AutoML Natural Language之类的工具通过自动执行令牌化、嵌入和模型架构决策来处理文本以进行情感分析或实体识别。 这些平台提取了诸如TensorFlow或PyTorch之类的深度学习框架的复杂性,使其对没有专门ML专业知识的开发人员可用。
AutoML通过利用诸如用于图像的卷积神经网络(CNN)和用于文本的基于Transformer的模型等技术来处理非结构化数据。 对于图像,AutoML工具通常会自动应用诸如调整大小,归一化和数据扩充之类的预处理步骤。 然后,他们搜索针对视觉任务优化的神经网络架构,例如ResNet或EfficientNet变体,同时调整诸如学习率之类的超参数。 对于文本,AutoML系统可能会使用嵌入(例如Word2Vec或BERT)将单词转换为数字表示形式,并尝试诸如循环神经网络(RNN)或Transformer之类的架构。 这些步骤包含在自动化管道中,使开发人员可以专注于标记数据和定义目标,而不是手动模型设计。
但是,AutoML在处理非结构化数据方面存在局限性。 尽管它简化了训练,但结果的质量仍然很大程度上取决于数据集的大小和清洁度。 例如,即使使用AutoML,使用标记不良或不平衡的数据训练图像分类器也会导致效果不佳。 此外,诸如视频分析或多语言文本处理之类的复杂任务可能需要超出AutoML默认选项的自定义体系结构。 开发人员还应注意计算成本:训练大型视觉或语言模型可能需要大量的GPU资源。 AutoML是一个实用的起点,但是团队可能需要将其与手动微调或特定于领域的优化相结合,以用于高级用例。