Ups and Downs: Modeling the Visual Evolution of Fashion Trends with One-Class Collaborative Filtering论文简介及其笔记| 论文笔记好用的论文笔记工具

Ups and Downs: Modeling the Visual Evolution of Fashion Trends with One-Class Collaborative Filtering

Vanessa He WWW 2016-09 3350 2017/05/23 16:46:14

成功的推荐系统不仅仅依赖于对用户偏好的建模，还依赖于对偏好的动态性的建模。而在某一些领域，如流行趋势，对偏好的建模较为困难，因为对产品图像及其动态演变的同时建模是比较困难的。
可视化因子难以建模的原因：1、为了抽取有价值的信息，需要较大的产品集（图像）和购买数据；2、因为可视化偏好是高度个性化的，所以需要能够建模和解释不同个体之间的偏好和差异；3、复杂的时序演化；4、解释非可视化因子的作用。

本文贡献：
1、为了单类协同过滤方法的更好推荐，本文对可视化进行了时序动态（temporal dynamics）建模；
2、还对非可视化维度和非可视化时序动态（non-visual dimensions and nonvisual temporal dynamics）进行了建模。

### **一、可视化类的时序动态建模**
**1、矩阵分解**
用户对产品的预测偏好：
![](http://www.datalearner.com/resources/blog_images/430512be-4f92-4dd1-ba67-8a291d5c680a.png)
其中，α是全局补偿，βu和βi是用户和产品的偏差，γu和γi分别是用来描述用户u和产品i的K维隐因子。实验中，γi是产品i的特性，γu是用户u对这些特性的偏好。

**2、可视化维度建模**
![](http://www.datalearner.com/resources/blog_images/ac50d6b0-0491-4b4c-88e1-105fa5e8ac80.png)··································式1
θu和θi表示K维可视化因子，用来表示用户u和产品i之间可视化兼容性。实验中，θi被视为产品i的显示可视化特征，因为深度卷积神经网络（Deep CNN）被证明在抽取图像特征上具有较好的表现，因此，本文研究中，fi表示产品i的深度卷积神经网络特征，F表示其维度数量，另外，研究还引入K'×F嵌入矩阵E，用于线性化的将高维特征向量fi嵌入到一个低维的可视化类型空间中，具体建模如下：![](http://www.datalearner.com/resources/blog_images/fcfbe8f8-188e-4213-aaa5-810ea5058189.png)。通过数据学习E，我们能够发现最能预测用户观点的K'可视化维度。

**3、可视化演化建模**
研究目标就是发现流行趋势，并且发现流行趋势是怎样在数据集生命周期上演化的。

**(1)时序演化下的可视化因子（Temporally-evolving Visual Factors）**
用θu(t)和θi(t)来表示用户或时间可视化因子在时间t下的函数。用于取代式1中的可视化交互部分。

**A、时序吸引力漂移（Temporal Attractiveness Drift）和时序权重漂移（Temporal Weighting Drift）**
随着时间的漂移，不同可视化维度上的产品吸引力在渐渐地增强或者损失。于是，嵌入式矩阵被扩展到时间依赖上：![](http://www.datalearner.com/resources/blog_images/5767d3c9-9dba-486d-baf9-4ffedb8a592d.png)。模型中的固定成分是E，时间依赖的漂移成分是ΔE(t)。于是，产品i在时间t时的可视化因子表示如下：![](http://www.datalearner.com/resources/blog_images/855c4b0e-88f5-497c-8c4e-14c700344b0f.png)。

当时尚随时间演化的时候，也许用户在每个可视化维度上的权重也在变化着。于是，我们引入一个第K维时序权重向量w(t)来描述用户在不同可视化维度上的演化，表示如下：![](http://www.datalearner.com/resources/blog_images/bcfc986d-fcaf-4d7b-8f6a-93061d559ea0.png)，其中⊙表示Hadamard产品（是一种由+1和-1组成的正交矩阵）。

综合以上两种动态变化，产品可视化因子公式表示如下：![](http://www.datalearner.com/resources/blog_images/4e6fec07-fc6c-4991-8eff-1e039cc11cd3.png)

***至此，介绍的是全部用户共享的全局动态（global dynamics）。下面，介绍一种本地动态（local dynamics）***

**B、时序个性化偏移（Temporal Personal Drift）**
也就是说，用户观点除了会被外部流行趋势影响之外，还有可能被他们自己的个人偏好所影响。这里为了对这种时序个性化偏移建模，借鉴了timeSVD++模型的研究，具体建模如下：
![](http://www.datalearner.com/resources/blog_images/1e3137eb-87d0-4e44-90c4-18e1b31e21b0.png)
这里，用户的平均反馈数据tu表示用户u在时间t上的偏差，该方法还引入两个向量θu和ηu来给每个用户建模，超参数K是从验证集中学习得到的。

**(2)时序演化下的可视化偏差（Temporally-evolving Visual Bias）**
研究引入一个时序可视化偏差是为了解释对所有因子而言共同的方差。
![](http://www.datalearner.com/resources/blog_images/4f980077-d174-47ba-9c52-5406d2bd586b.png)
于是，产品i在时间t上的可视化偏差被表示成<β(t),fi>。这一形式被引入到式1中的固定产品偏差**βi**中。

***至此，介绍的是如何对可视化演变建模。然而，数据中还存在一种非可视化的时序演变，例如销售、促销或者新产品的出现。融入这样的数据进入模型中不仅会提高预测精度，还会增强模型的可解释性。下面，介绍一种非可视化时序演变***

**(3)非可视化时序演变（Non-Visual Temporal Dynamics）**
**A、子产品的时序动态（Per-Item Temporal Dynamics）**
在某个时期而非其他时期，各种因素会引起一个产品被购买。为此，这一部分便是在式1中的固定产品偏差**βi**中引入一个时序变量**βi(t)**.
**B、子类别的时序动态(Per-Subcategory Temporal Dynamics)**
Ci表示产品i属于的子类，于是，这一部分便是在式1中的固定产品偏差**βi**中引入一个时序变量**βCi(t)**.

**综合以上所有分析，最终用户u对产品i在时间t下的预测评分如下：**
![](http://www.datalearner.com/resources/blog_images/74d722ab-7d3d-4bbf-9aa9-9cf2077ee9fb.png)

**利用上述构建的时序偏好预测器，我们的目标就是在时间t时为每个用户产生一组为产生过交互的产品个性化排序。**

**4、流行期分割（Fashion Epoch Segmentation）**
流行期分割可以参考timeSVD++的相关论文研究，最终我们的数据集被分割成N个epochs（用ep表示）,每个epoch都有一组参数：![](http://www.datalearner.com/resources/blog_images/17f07e3c-cea7-4bb0-882d-bcda5d007dac.png)
于是，用户u对产品i在ep段内的偏好预测表示如下：![](http://www.datalearner.com/resources/blog_images/5bdb279d-1eb3-483d-8aac-07bdf36e4472.png)。其中，函数ep(·)返回时间t对应的epoch索引。

### **二、模型学习**
**1、log似然函数最大化**
![](http://www.datalearner.com/resources/blog_images/0afca7e1-aa4a-4406-9f64-67c478a42636.png)
![](http://www.datalearner.com/resources/blog_images/d19d9d29-2596-43f3-97f4-3f996ae6331d.png)
**2、迭代优化过程**
两种思路：一种是固定模型参数，改变时间线的分割；另一种是固定时间线的分割，不断改变模型参数。
*具体学习过程请参考原论文，这里不做详细解释。*

#### **扩展：可视化特征提取方法**
本文研究采用一种预训练的卷积神经网络，也叫做Caffe偏好模型，这一模型构建了一个具有5个卷积层和3个全连接层的模型，对120万的图片数据进行预训练，最终全连接层之后得到了F=4096维度的可视化特征。

赏

支付宝扫码打赏

如果文章对您有帮助，欢迎打赏鼓励作者