作者提出了一个分层的贝叶斯模型—— Collaborative Deep Learning(CDL),利用深度表示学习对物品的内容信息进行建模,并将其与针对评分矩阵的协同过滤整合在一起。
符号描述
$\mathbf{X}_c \in \mathbb R^{J \times S}$表示由J个物品组成的矩阵,矩阵中的每一行j是一个词袋向量$\mathbf{X}_{c, j*}$(词汇表的大小为S)。
$\mathbf{R} = [R_{i,j}]_{I \times J}$表示由I个用户、J个物品组成的二元评分矩阵。
问题
给定$\mathbf{R}$中的部分评分以及内容信息$\mathbf{X}_c$,预测$\mathbf{R}$中的其他评分。
CDL
CDL的生成过程如下:
目标函数
最大化后验概率等价于最大化$\mathbf{U}, \mathbf{V}, \{\mathbf{X}_l\}, \mathbf{X}_c, \{\mathbf{W}_l\}, \mathbf{b}_l, \mathbf{R}$的联合对数似然。
参数更新
预测
$$
\mathbf{R}^*_{ij} \approx (\mathbf{u}_i^*)^T (f_e (\mathbf{X}_{0,j*}, \mathbf{W}^{+*})^T + \mathbf{\epsilon}^*_j) = (\mathbf{u}_i^*)^T \mathbf{v}_j^*
$$