零样本学习 (ZSL) 使 AI 模型能够对未明确训练的类别或任务进行预测。 这是通过利用辅助信息(例如语义属性或文本描述)来推广到未见类别来实现的。 与需要每个类别的标记示例的传统监督学习不同,ZSL 使用已知数据和未知数据之间的关系来推断结果。 这种方法在为每个可能的类别收集标记数据不切实际或成本高昂的情况下特别有用。
ZSL 的一个关键应用是在计算机视觉中,特别是用于图像分类。 例如,一个经过训练可以识别猫、狗和鸟等动物的模型,稍后可以识别新的物种,例如企鹅,而无需额外的训练。 这是通过将视觉特征映射到跨类共享的语义属性(例如,“有翅膀”、“生活在寒冷的气候中”)来实现的。 同样,ZSL 可以在利基领域(如医学成像)中对对象进行分类,因为罕见疾病可能缺乏足够的训练数据。 通过将图像模式链接到文本症状描述,模型可以诊断出它们以前从未明确见过的疾病。
ZSL 擅长的另一个领域是自然语言处理 (NLP)。 例如,文本分类模型可以通过使用词嵌入或元数据将文档分类到训练期间不存在的主题中。 通过分析文章文本和类别描述之间的语义相似性,一个经过关于体育和政治的新闻文章训练的模型可以推断出一个像“气候变化”这样的新类别。 在聊天机器人中,ZSL 允许系统处理超出其原始训练范围的用户意图。 例如,客户服务机器人可以通过利用产品描述或常见问题解答来回复有关未发布产品的查询,从而避免了重新训练的需要。 这种灵活性使 ZSL 在经常出现新任务的动态环境中具有价值。