零样本学习 (ZSL) 使推荐系统能够通过利用辅助信息(例如项目属性或用户偏好)来处理没有先前交互数据的项目或用户。与依赖历史交互(例如,点击、购买)的传统协同过滤方法不同,ZSL 模型通过将其特征与现有知识联系起来,推断出对未见项目或用户的推荐。例如,一个基于类型、演员和情节关键词训练的电影推荐器可以通过将新电影的元数据与用户已经喜欢的电影中的相似属性进行匹配来推荐一部新电影,即使这部新电影还没有用户评分。这种方法通过减少对稀疏交互数据的依赖来解决冷启动问题。
ZSL 的一个实际应用是使用语义嵌入来表示共享特征空间中的项目和用户。例如,在电子商务系统中,可以使用自然语言处理 (NLP) 模型(如 BERT)将产品描述和用户偏好编码为嵌入。如果新产品没有购买历史记录,那么如果它的嵌入与用户的偏好向量一致,则可以推荐该产品。类似地,通过跨域映射类型或主题等特征,跨域推荐(例如,根据用户的电影偏好推荐书籍)变得可行。例如,喜欢科幻电影的用户可能会收到标有“科幻”或由与该类型相关的作家撰写的书籍推荐,即使系统从未观察到用户与书籍之间的直接交互。
然而,在推荐系统中实施 ZSL 需要仔细设计。首先,辅助数据(例如,项目元数据)的质量直接影响性能——稀疏或嘈杂的特征可能导致较差的推荐。其次,模型必须在利用已知交互和泛化到未见项目之间取得平衡。混合方法,例如将 ZSL 与协同过滤相结合,通常效果最佳。例如,流媒体服务可能会使用 ZSL 根据音频特征(例如,节奏、类型)来推荐新歌曲,同时仍然优先考虑与用户收听历史相似的曲目。开发人员还应评估 ZSL 模型在覆盖率(推荐了多少未见项目)和冷启动场景中的准确性等指标,以确保稳健性。