【论文阅读】ST-PIL: Spatial-Temporal Periodic Interest Learning for Next Point-of-Interest Recommendation

Metadata

authors:: Qiang Cui, Chenrui Zhang, Yafeng Zhang, Jinpeng Wang, Mingchen Cai
container:: Proceedings of the 30th ACM International Conference on Information & Knowledge Management
year:: 2021
DOI:: 10.1145/3459637.3482189
rating:: ⭐⭐⭐
share:: false
comment:: 模型主体为 LSTM，分别学习长期和短期的用户行为模式，并通过 Attention 融合

前言

CIKM，2021：ST-PIL: Spatial-Temporal Periodic Interest Learning for Next Point-of-Interest Recommendation

问题描述

分别给定用户集合 $U = \{ u_1, u_2, \cdots, u_{\vert U \vert} \}$ ， POI 集合 $P = \{ p_1, p_2, \cdots, p_{\vert P \vert} \}$ 以及类别集合 $C = \{ c_1, c_2, \cdots, c_{\vert C \vert} \}$ ，其中每个位置 $p_i$ 都有一个对应的 $(lat, lon)$ 坐标相关联。

（check-in）一个用户 $u$ 在 $t$ 时刻的 check-in 可以表示为 $h^t=(p^t,c^t,w^t,m^t,g^t)$ ，分别表示地点，类别，星期，小时以及地区。

（user trajectory）用户轨迹是由特定用户的一系列时间顺序的签到记录来定义的，即 $H = \{ h^1, h^2, \cdots, h^{t-1} \}$ 。

（next POI recommendation）给定用户 $u$ 的活动轨迹 $H$ ，预测用户 $u$ 最可能去的 POI top- $k$ 。

OverView

通过对用户 POI 访问轨迹及其上下文信息（如时间、空间）的研究，可以对 POI 的预测提供帮助：

用户的活动受到时间的限制，并表现出天和小时的模式。例如一些用户会在周末去度假；一些用户会在晚上去餐厅；
用户在不同区域经常表现出特定的行为模式；
用户会在一个特定的时间访问同一个 POI，即小时维度上的模式。

论文提出 Spatial-Temporal Periodic Interest Learning network (ST-PIL)，分别学习长期和短期的用户行为模式。充分考虑周期性，学习空间、时间上下文信息，构建了日、小时、区域和小时区域粒度的周期性数据。

ST-PIL

模型架构如下图所示：

Embedding Layer

论文使用 Geohash-5 对 GPS 位置进行编码，得到 $G = \{ g_1, g_2, \cdots, g_{\vert G \vert} \}$ 。时间信息表示为 day of week $W = \{ w_1, \cdots, w_7 \}$ 以及小时时间 $M = \{ m_1, \cdots, m_{24} \}$ 。

Geohash 将 GPS 空间信息表示区域信息

Long-Term Module

在长期模块中，论文使用 day of week 作为时间上下文信息，并使用层内注意力来学习长期兴趣特征。

首先，论文构建与用户签到序列长度相同的每日掩码序列，并将所有签到序列按天划分，得到 daily embedding。例如，使用序列 $d=[1,0,1,\cdots,0]$ 表示用户在星期一发生的访问行为，以此进行按天为单位的划分。接着通过平均池化操作并进行全连接，得到 7 天的模式特征 $\boldsymbol{L} = [\boldsymbol{l}_1; \boldsymbol{l}_2; \cdots; \boldsymbol{l}_7]$ 。

之后，论文应用 attention 获取每日模式的层次特征，query 向量为：

$\boldsymbol{q}^t = [\boldsymbol{p}^t,\boldsymbol{c}^t,\boldsymbol{w}^t,\boldsymbol{m}^t,\boldsymbol{g}^t]$

并应用 Bahdanau attention：

$\begin{aligned} e_j^t &= \boldsymbol{v}_e^T \tanh(\boldsymbol{V}_1\boldsymbol{q}^t + \boldsymbol{V}_2\boldsymbol{l}_j^t) \\ \boldsymbol{e}^t &= \text{softmax}(\{ e_1^t, e_2^t, \cdots, e_7^t \}) \\ \boldsymbol{l}^t &= \sum_{j=1}^7 e_j^t \boldsymbol{l}_j^t \end{aligned}$