AI大模型学习
AI博客
原创AI博客
大模型技术博客
AI大模型排行榜
业界大模型评测基准
全球大模型最新评测基准结果
大模型综合能力排行榜
大模型编程能力排行榜
LMSys ChatBot Arena排行榜
Berkeley大模型工具使用能力排行榜
OpenLLMLeaderboard中国站
全球大模型最新评测结果
AI大模型大全
大模型部署教程
2023年度AI产品总结
AI资源仓库
AI领域与任务
AI研究机构
AI数据集
AI开源工具
数据推荐
AI大模型
国产AI大模型生态全览
AI模型概览图
AI模型月报
AI基础大模型
AI大模型工具导航
AI大模型工具导航网站
在线聊天大模型列表
Leveraging Social Connections to Improve Personalized Ranking for Collaborative Filtering
Vanessa He
CIKM
2014-12
2122
2017/03/01 16:57:16
在现有的研究论文中,尽管很多研究利用**社交信息**解决“one-class”推荐问题(没有评分信息),但是没有研究考虑到来自好友的反馈信息如何模型化用户的产品偏好排序这一问题。本文研究的正是这一问题。 **论文基于以下前提来建模:**  **本文重要贡献:** 1、建立一个叫做Social-BPR(SBPR)的排序算法; 2、在冷启动推荐问题上取得重要进展。 **一、问题描述** * U表示用户集,I表示产品集,G={U,E}表示社交网络,(u,v)∈E表示用户u和v是有社交联系的,“反馈”F={(u,i)}表示用户与产品间的反馈信息。 * 可观测产品与不可观测产品:可观测产品O_u∈I表示用户明确表示了评分或者偏好的产品集,反之则想法。 * 三类反馈: 1)正向反馈:P_u={(u,i)}表示用户产品对,其中i∈O_u,可以是用户选择、购买、评分或者评论等的产品。 2)社交反馈:SP_u={(u,k)}表示用户u没有选择某产品,但是至少有一个用户u的好友v选择某产品,(u,v)∈E,k∈O_v ∩(1-O_u). 3)负向反馈:N_u={(u,j)},j表示(1-O_u)∩(1-O_v)...(1-O_v’),即表示用户及其好友都没有选择的产品集。这里的负向仅仅表示没有显示信息可以被观测到而已,并不一定表示用户不喜欢该产品。 * 鉴于社交反馈,本文还引入了社交系数S_uk,(u,k)∈SP_u,表示了用户u的社交关系对某产品的k的态度,本质上也就是说,如果用户u的好友对产品k有较大的偏好,尽管用户u没有选择该产品,也假定用户u喜欢产品k。 **二、社交个性化排序** **1、模型假设** 在贝叶斯个性化排序中假定如下:  结合社交反馈信息,本文提出如下基本假定:  其中,x_ui表示用户u对于正向反馈i的偏好,x_uk表示用户u对于社交反馈k的偏好,x_uj表示用户u对于负向反馈i的偏好。 但是,如果一个用户从好友那儿了解到j,但是他却不选择j,这从侧面反映了用户不喜欢j。因此,本文提出了如下备选假定: 两种假定的不同之处在于有没有考虑负向反馈和社交反馈之间的偏好顺序。但是,两种假定都可以通过下面的模型建模。 **2、建模** 上面提到的基本假定可以被用于最大化AUC,一个较大的AUC值,也就意味着越大,并且也越大。 因此,对于一个用户u而言,优化准则可被表示如下:  这里的指示函数δ(u,i,k)的意思是,如果i∈P_u并且k∈SP_u,那么δ(u,i,k)=1,否则为0;同理,ζ(u,k,j)的意思是,如果k∈SP_u并且j∈N_u,那么ζ(u,k,j)=1,否则为0。 优化准则的求解,和BPR的求解过程类似([可以参考本博主的关于BPR的论文笔记](http://www.datalearner.com/paper_note/content/300026 "可以参考本博主的关于BPR的论文笔记")),利用sigmoid函数来优化,于是,目标函数变成最大化下面的目标函数:  其中,偏好函数可以通过矩阵分解为:;模型参数。 值得注意的是,上面的目标函数中引入了社交系数S_uk,实现控制每一个抽样对对目标函数的贡献影响,S_uk的具体含义是指用户u没有选择但其好友选择的好友数。也就是说,如果S_uk越大,那么1/(1+S_uk)就越小,(x_ui-x_uk)的系数就越小,k与i的社交距离就越小,则表明社交反馈里的k越有可能成为正向反馈。 **3、模型学习** 模型的学习与BPR中的类似,使用随机梯度下降来优化目标函数,因为是要最大化目标函数,所以沿着梯度上升的方向更新参数。  **4、训练实例抽样策略** (1)均匀抽样:所有的正向、社交和负向反馈均从P_u、SP_u和N_u中均匀抽取。 (2)静态抽样:正向和负向反馈从P_u和N_u中均匀抽取,社交反馈从集合分布中抽取。 (3)自适应抽样:正向反馈从P_u中均匀抽取,社交和负向反馈从如下分布中抽取,  (4)动态负向抽样:正向和社交反馈从P_u中均匀抽取,负向反馈根据偏好评分函数来抽样,具体请查看论文原文,此处不做解释。 **三、实验结果**   **四、未来工作** 1、如何在SBPR中加入评分信息? 2、探索上下文环境信息来构建用户的产品偏好排序模型?
赏
支付宝扫码打赏
如果文章对您有帮助,欢迎打赏鼓励作者
Back to Top