- 收藏
- 加入书签
基于时间衰减注意力机制的用户长短期兴趣融合建模
摘要:本文聚焦于推荐系统中用户长短期兴趣融合建模的关键问题,提出一种基于时间衰减注意力机制的创新模型。通过引入动态分块策略、上下文感知的向量化增强技术,以及短期兴趣注意力模块(STI Module)与长期兴趣注意力模块(LTI Module)的协同设计,实现了用户兴趣在不同时间尺度上的精准捕捉与融合。实验表明,该模型在推荐相关性和用户满意度方面显著优于传统方法,尤其在处理用户动态兴趣变化时表现出色。关键词:时间衰减注意力机制;用户长短期兴趣融合;推荐系统;动态分块
一、引言
在信息爆炸的时代,推荐系统已成为连接用户与海量信息的关键桥梁。然而,传统推荐系统往往难以准确捕捉用户兴趣的动态变化,导致推荐内容 户实际需求存在偏差。 用户 兴趣具有显著的时间依赖性,既包含长期稳定的偏好(如对某类商品的持续关 含短期突发的兴趣 近期对某款新品的兴趣激增)。如何有效融合用户的长短期兴趣,成为提 的关键挑战。本文 一种基于时间衰减注意力机制的用户长短期兴趣融合模型,旨在通过动态分块策略、上下文感知的向量化增强技术,以及短期与长期兴趣注意力模块的协同设计,实现用户兴趣在不同时间尺度上的精准捕捉与融合。
二、相关研究
2.1 用户兴趣建模方法
用户兴趣建模是推荐系统的核心任务之一,旨在通过分析用户的历史行为、偏好等信息,构建用户兴趣模型,以预测用户未来的行为或偏好。传统方法包括基于协同过滤的方法和基于内容的方法。协同过滤方法通过分析用户与物品之间的交互历史,寻找相似用户或物品进行推荐,但难以捕捉用户兴趣的时序变化。随着深度学习的发展,基于神经网络的兴趣建模方法逐渐成为主流。这些方法通过自动提取用户行为和物品特征的深层表示,提高了兴趣建模的准确性。
2.2 注意力机制在推荐系统中的应用
注意力机制作为一种有效的特征提取和融合方法,已在自然语言处理、计算机视觉等领域取得显著成功。在推荐系统中,注意力机制通过计算用户行为与物品之间的相似度,赋予不同行为或物品不同的权重,从而更准确地捕捉用户兴趣。然而,传统注意力机制在处理用户兴趣的时序变化时存在局限性。例如,标准注意力机制通常平等对待所有历史行为,忽略了时间对行为重要性的影响。为此,研究者开始探索时间衰减注意力机制,通过引入时间衰减因子,强调最近行为的重要性,从而更准确地反映用户兴趣的动态变化。
2.3 上下文感知的推荐系统
上下文感知的推荐系统通过考虑用户行为发生的上下文信息(如时间、地点、设备等),提高推荐的准确性和个性化程度。上下文信息可以帮助推荐系统更好地理解用户需求,捕捉用户兴趣的细微变化。在上下文感知的推荐系统中,动态分块策略是一种有效的技术。通过主题一致性检测和动态调整块大小,可以确保分块的上下文相关性和语义完整性,从而保持推荐内容的相关性。
三、基于时间衰减注意力机制的用户长短期兴趣融合模型
3.1 模型总体架构
本文提出的基于时间衰减注意力机制的用户长短期兴趣融合模型,主要由动态分块模块、上下文增强模块、短期兴趣注意力模块(STI Module)、长期兴趣注意力模块(LTI Module)、融合模块(Fusion Module)以及个性化提示词生成模块组成。模型输入为用户查询、用户行为序列以及物品特征,输出为推荐物品列表及个性化提示词。
3.2 动态分块策略
动态分块策略旨在通过主题一致性检测和动态调整块大小,确保分块的上下文相关性和语义完整性。具体实现时,引入文本复杂性指标(如句子长度、词汇多样性TTR、句子结构复杂度)作为动态阈值,指导分块过程。
文本复杂性指标计算:
句子长度:统计文本中句子的平均长度。
汇多样性(TTR):计算文本中不同词汇的数量与总词汇数量的比句子结构复杂度:使用句法分析工具(如 spaCy 或NLTK)解析句子,统计从句和并列句的数量
动态阈值调整:
基于上述指标计算复杂性指数(Complexity Index):
ComplexityIndex=w1×SentenceLength+w2×T
3.3 上下文增强模块
上下文增强模块通过检索产品向量并查询详细的产品结构化数据(如价格、分类等),结合私域用户数据(基础信息、历史行为等),生成增强后的上下文表示。具体步骤如下:
产品向量检索:使用预训练模型(如BERT)提取产品描述的
结构化数据查询:根据产品 ID 查询价格、分类等结构化信息。
用户数据拼接:将用户基础信息、历史行为序列与产品数据进行拼接,形成增强后的上下文表示。3.4 短期兴趣注意力模块(STI Module)
短期兴趣注意力模块旨在捕捉用户近期的兴趣变化,通过引入时间衰减因子强调最近行为的重要性。具体实现如下:
输入:
Query Embedding (Q):用户查询的嵌入表示。
Item Embeddings (E):推荐商品的嵌入表示集合。
User Behavior Sequence (S):用户行为序列的嵌入表示。
注意力计算:
α=WqQ

其中, Wq 和Ws 为线性变换矩阵,TimeDecay(ti)为时间衰减函数,定义为:

γ为控制衰减速度的正数,t0 为当前时间点,ti 为行为发生时间。缩放与归一化:

AttentionWeight=Softmax(AttentionScore)
其中,dk 为商品嵌入的维度。
3.5 长期兴趣注意力模块(LTI M
长期兴趣注意力模块旨在捕捉用户稳定的长期偏好,通过聚合用户历史行为中的长期模式进行建模。具体实现如下:
输入:
同 STI Module。
注意力计算:
忽略时间衰减因子,直接计算用户行为序列与商品之间的相似度:


AttentionWeightlong=Softmax(AttentionScorelong)
3.6 融合模块(Fusion Module)
融合模块通过加权求和的方式结合短期与长期兴趣注意力权重,生成最终的注意力分布。具体实现如下:
FusedAttentionWeight =λ .AttentionWeight +
(1-λ). AttentionWeightlong
其中, λ为平衡短期与长期兴趣的权重系数,可根据实际需求调整。
四、实验数据
为验证模型性能,我们在公开数据集 Amazon Books 和 MovieLens-20M 上进行实验,对比基线模型(包括DIN、DIEN 和 BERT4Rec)。实验采用 AUC 和 NDCG@10 作为评估指标,结果如表 1 所示。
表 1 模型性能对比(AUC/NDCG@10)

实验表明,本文模型在两项指标上均显著优于基线( (p<0.01) ),尤其在 Amazon Books 数据集上 AUC 提升3.0% 。进一步分析显示,时间衰减机制使短期兴趣模块对近期行为的关注度提升 27% ,而动态分块策略将长短期兴趣融合的误差降低 15% 。消融实验验证了各模块的必要性,移除任一模块均导致性能下降4%以上。
五、结论
本文提出一种基于时间衰减注意力机制的用户长短期兴趣融合模型,通过动态分块策略、上下文感知的向量化增强技术,以及短期与长期兴趣 意力模块的协同设计,实现了用户兴趣在不同时间尺度上的精准捕捉与融合。通过不断优化和创新,基于时间衰减注意力机制的用户长短期兴趣融合模型将为推荐系统的个性化与智能化发展提供更强有力的支持。
参考文献:
[1]李会圆.基于多时间尺度用户兴趣提取的网络广告点击率预测模型研究[D].北京外国语大学,2023.
[2] 刘树栋,张可,陈旭.基于多维度兴趣注意力和用户长短期偏好的新闻推荐[J].中文信息学报, 2022,36(9):10.
京公网安备 11011302003690号