推荐系统通过解决稀疏交互数据的挑战来预测长尾商品——不太受欢迎或小众的产品。传统的协同过滤方法通常难以处理这些商品,因为它们依赖于用户与商品的交互模式,而长尾条目的交互数据有限。为了克服这个问题,系统使用诸如混合模型之类的技术,将协同过滤与基于内容的信息相结合。例如,电影推荐系统可以使用流派、导演或关键词元数据来补充稀疏的用户评分。即使数据有限,诸如神经协同过滤(NCF)之类的神经网络也可以学习用户和商品的潜在表示,从而在小众商品和具有特定兴趣的用户之间建立联系。
另一种方法是利用元数据或辅助信息来丰富商品表示。例如,电子商务系统可以使用产品描述、图像或类别层次结构来识别长尾商品和更受欢迎的商品之间的相似性。基于图的方法,如图神经网络(GNN)可以以统一的结构对用户、商品和属性之间的关系进行建模。例如,书籍推荐系统可以将一本小众科幻小说与同一作者的其他书籍或具有相似主题的书籍联系起来,即使很少有用户与之互动。 诸如迁移学习之类的技术也有助于通过在具有丰富数据的领域(例如,受欢迎的产品)上预训练模型,然后针对长尾场景对其进行微调。
最后,探索策略对于发现长尾商品至关重要。系统可能会包含 bandit 算法,该算法在推荐已知偏好与探索新商品之间取得平衡。例如,音乐流媒体服务可能会偶尔推荐与用户最喜欢的流派相似的鲜为人知的曲目。 此外,诸如覆盖率(衡量推荐了多少独特的商品)和多样性(确保推荐不过于相似)之类的评估指标有助于优先考虑长尾商品的包含。开发人员还可以实现双塔模型,其中单独的神经网络对用户和商品进行编码,即使对于互动历史记录最少的商品,也可以实现有效的匹配。 通过结合这些方法,系统可以有效地推荐小众商品,同时保持相关性。