一种融合多源信息的兴趣点推荐方法
本文提出一种融合多源信息的兴趣点推荐方法,下面分别从用户历史行为数据建模、地理空间影响建模以及用户社交网络关系计算等方面说明本文提出的机制。
用户历史行为数据建模。
在本文中,首先对用户历史行为数据进行建模,具体如下:
本文使用用户隐式反馈数据进行建模,假设有m个用户ui和n个兴趣点lj,将用户和兴趣点映射到一个潜在的低维隐空间上构建矩阵C,C[i][j] =1表示用户i访问过兴趣点j,反之则为0。在联合隐式空间上,把用户对兴趣点的偏好建模成它们在隐式空间的点积,定义用户ui对兴趣点lj的偏好近似采用用户和地点的潜在特征向量内积:
将上述映射问题进行进一步扩展,得到如下最小化加权平方误差:
其中W表示权值矩阵,将用户访问过的兴趣点定义为正样本,给予其较高的权值,用户未访问过的兴趣点则为负样本并且令其权重为1,,作为目标函数的正则化项以减低其泛化误差,其中矩阵W的表达式为:
其中α定为10,ri,j是用户ui访问兴趣点lj的次数。
地理空间影响建模。
本文对于用户ui对兴趣点lj的偏好采用该用户对兴趣点lj的偏好预测以及lj的近邻地点的偏好共同表示,同时使用地理区域位置关系加权策略来弥补经典矩阵分解模型中对于地理位置的建模缺陷,则用户对兴趣点的偏好可表示为:
其中α∈[0,1]是加权参数,用来控制邻近位置的影响。N(lj)表示兴趣点lj的邻近地点集合。Sim(lj,lk)是指兴趣点lj对lk地理影响的权重。Z(lj)=Σlk∈N(lj)Sim(lj,lk),Sim(lj,lk)采用高斯函数来表示,即,
其中,xj,xk表示兴趣点lj,lk的经度和纬度,上述公式就是从位置的角度出发考虑目标地点lj和它相近地点之间的关系。设置两地点之间最大距离为D=10000,若超出该距离则不考虑。
令G=αE+(1-α)ST,E,S∈Rnxn,Sj,k=sim(lj,lk)/Z(lj),E为单位矩阵,则用户对兴趣点的近似偏好为:
用户社交网络关系建模。
根据现实好友之间的社交网络,本文认为用户之间的社交关系是相互的,这里采用余弦相似度来衡量用户间的相似度:
其中Sak表示用户a是否在地点k签到,Sbk表示用户b是否在地点k签到,取值为1表示签到过,取值为0表示没有签到。L表示所有地点的集合,lk表示属于L集合的某一地点。
传统相
用户/建模/兴趣点/地点/偏好/lk/兴趣/点lj/lj/本文/
用户/建模/兴趣点/地点/偏好/lk/兴趣/点lj/lj/本文/
-->