将隐式反馈融入模型涉及使用间接用户信号(如点击、浏览时长或购买历史)来推断偏好。与显式反馈(如星级评分)不同,隐式数据存在噪声,需要能解释模糊性的方法。三种常见的方法包括加权矩阵分解、神经协同过滤和贝叶斯个性化排序(BPR)。这些方法侧重于解释用户行为模式,同时有效地处理缺失或不完整的信号。
一种方法是加权矩阵分解,它将隐式反馈视为用户偏好强度的指标。例如,在推荐系统中,用户观看一部电影的 90% 可能表明比短暂点击更强的兴趣。该模型为这些交互分配更高的权重,为负面例子(如未交互的项目)分配更低的权重。这有助于模型学习潜在的用户和项目因素,同时避免过度强调稀疏或嘈杂的信号。TensorFlow 或 PyTorch 等库可以通过调整损失函数以包含置信度权重来实现这一点,从而确保模型优先考虑有意义的交互。
另一种方法是神经协同过滤,它使用深度学习来建模复杂的用户-项目关系。例如,一个双塔神经网络可以分别编码用户和项目特征,然后将它们组合起来以预测交互的可能性。隐式反馈被用作训练数据,其中观察到的交互是正例,未观察到的交互被视为潜在的负例(通过抽样)。负采样(选择未观察到的项目的一个子集作为负例)等技术有助于管理计算成本和数据稀疏性。Spotify 等平台使用此方法的变体来根据收听历史推荐歌曲,其中跳过或重播充当隐式信号。
最后,贝叶斯个性化排序(BPR)优化项目排名,而不是预测绝对偏好。BPR 假设用户更喜欢交互过的项目而不是未交互过的项目,并在训练期间使用成对比较。例如,在电子商务环境中,如果用户购买了产品 A 但未购买产品 B,则模型会学习将 A 排在更高位置。这种方法非常适合隐式数据,因为它避免将缺失的交互视为显式负例。LightFM 等框架开箱即用地支持 BPR,使开发人员可以轻松地将其集成到推荐系统中。结合数据增强等技术(例如,从停留时间合成伪交互),这些方法能够对隐式用户行为进行稳健建模。