paper-recommender

热点争议问题

NCF作者自己发的帖子//www.zhihu.com/question/396722911/answer/1251909703?from=timeline&utm_medium=social&utm_oi=811591930231275520&utm_source=wechat_session&s_r=

欢迎来辩

有助于统一标准。
有助于提升自身知识水平。
有助于结交朋友。
项目起源
本项目起源于写毕业论文时，导师说的推荐系统方向，就此入坑。
项目历史
本项目的项目结构起源于PredictionIO。因为PredictionIO需要安装集群环境，而且在集群环境下测试算法的指标，所需的计算机资源更多(因为穷，小破笔记本)。
集群环境下跑一次需要30分钟，到后面引入聚类等其他机器学习的算法，运行效果更慢。发现并不是大力出奇迹，而是算法决定效果。
所以为了更快的验证算法，特意参考了PredictionIO的部分源码，搭建的单机版的PredictionIO。
经验总结
听到最流行最火的东西，一定要冷静，一定要弄清楚其适范围，再决定是否去使用。(如想用大数据相关的东西来提高推荐准确率，请注意准确率与大数据没有很多直接的关联，与具体的算法有关。这种是想大力出奇迹)
复现论文时，一定要注意其前置条件和评测指标。
对以Neo4j图数据库为代表的图数据库推荐系统持保留态度，亲测TopN推荐效果并不好。
对以神经网络特别是NCF为代表的神经网络协同过滤算法持保留态度。因用java实现后，在TopN领域效果并不好，不排除本人水平太差，运行结果在result文件夹中。

项目的前置条件

面向TopN领域，非评分预测领域。
本论文中使用的数据集是MovieLens的MovieLens 100K 。使用其中的用户对电影的评分信息,位于u.data文件中。其数据格式为：用户ID、物品ID，评分和时间戳。
评测指标：

在本论文中使用这四个指标是基于一个假设，即：若用户喜欢这部推荐的电影，则会观看(点击)并评价(有评分信息)这部电影；若用户不喜欢(不点击)推荐的这部电影，则不会观看也不会评价(无评分信息)。

推荐算法生成的结果，用户对其只有两种交互的可能性，即喜欢与不喜欢，是一个典型的二分类问题。推荐的电影与用户交互的结果有四种类别，如下表所示:

| 真实情况 | 预测正例 | 预测反例 |
| :———: | :———————————: | :———————————: |
| 正例 | TP（预测为正，实际为正） | FN（预测为负，实际为正） |
| 反例 | FP（预测为正，实际为负） | TN（预测为负，实际为负） |

在本论文推荐算法生成的推荐列表中的电影，都代表预测结果为正例。因为预测结果为负例的电影，即用户不会看的电影，不会推荐给用户。预测结果中包含推荐后用户确实观看的电影(TP)，和推荐了但是没有观看的电影(FP)。而测试集中用户的电影列表都是真实情况的正例，其中包含被预测结果命中的正例(TP)和不包含在推荐列表中的反例(FN)。
- 准确率
- 召回率
- F1分数
评测方法:

本论文采用K折交叉验证法，先将原始数据集D划分为k个大小相似的互斥子集，即D=D1UD2UD3U...UDk 。按照划分顺序从中选择一个子集作为测试集，另外k-1个子集为训练集；即可得到k组训练集和测试集，最终返回这k组测试结果的均值，本论文中k的值为5。论文中相关电影的推荐列表长度为10，即TopN @10。

主要验证步骤如下：

1). 选择一个数据子集作为测试集。
2). 对测试集中所有数据按照用户ID分组。
3). 把用户的ID作为参数，调用预测的方法。
4). 接收到模型生成的推荐列表后，与该用户所拥有的电影集合进行验证。
5). 生成验证结果。
6). 选择下一个数据子集，然后重复1-5，直到所有的数据集都被作为测试集。
7). 最后返回所有测试组指标的均值作为最终结果。