- 收藏
- 加入书签
个性化商品推荐系统的混合推荐算法研究
摘要:随着大数据时代的到来,信息爆炸式增长,用户面临信息过载问题。基于此,推荐系统应运而生,能够根据用户喜好主动筛选数据,为用户提供精准的个性化推荐服务,降低了用户获取信息的难度,且能够有效提高企业的效益,因此对推荐系统的研究具有重要意义。本文深入分析了现有深度推荐算法存在的主要问题,提出了基于深度学习的推荐算法,即基于编码器增强的推荐算法 EnDeepFM。最后,实现了基于个性化推荐算法的商品推荐系统,该推荐系统可以筛选出用户感兴趣的商品,实时的推荐给用户。
关键词:个性化推荐;推荐系统;编码器
引言
随着互联网及各种智能移动设备在全球范围内的发展和普及,互联网逐渐满足了人们对信息的需求,基于互联网的大量网络信息已经走进了我们的生活[1]。如今,普通用户可以轻松的浏览各种新闻、影视、商品等信息,但是随着这些信息的激增使人们难以找到自己感兴趣的内容,从而导致信息过载问题[2]。
然而,在这个信息过载的时代,无论是信息消费者还是信息生产者都遇到了巨大的挑战:用户如何在琳琅满目的电商平台中快速便捷的找到自己心仪的商品,平台供应商如何将自己的商品精准的推送至需要的客户面前。为了解决用户在线上购物时遇到的“信息过载”问题,早期主要是通过分类目录和搜索引擎来实现的。分类是对商品按照类别信息进行分类和打标签,使得用户可以根据类别目录快速地找到自己需要的商品,但是这种方式在面对大量商品的时候,无法精确覆盖所有的商品。搜索引擎是通过输入关键字进行搜索,可以根据商品名称快速找到相关商品。但是搜索引擎比较被动,在面对大量数据的时候,需要用户精确地查找,才能找到与之匹配的商品。为了更好帮助用户在无法提供准确关键词的情况下,快速准确地找到目标商品,随之出现了商品推荐系统[3]。
当前,推荐系统被广泛的应用于电子商务网站中,如Amazon、淘宝、京东等网站中都有着商品推荐系统的应用[4],对此推荐系统有非常大的商业研究价值,既可以帮助用户快速找到自己满意的商品,又可以帮助商家推销自己的产品,达到双赢的效果,所以对推荐系统进行研究有较高的实际意义和应用价值。
1 推荐系统概述
随着大数据时代的到来,信息过载已成为人们处理信息时的挑战,导致人们无法从指数级增长的信息中快速、准确地查找到自己感兴趣的信息,同样的,信息也无法准确呈现给目标用户。基于此,推荐系统应运而生,完美连接了用户和信息,给商业带来了巨大价值以及广阔的应用前景。1994年,由明尼苏达大学开展的协同过滤研究项目,为推荐系统的发展奠定了基础。1998年,Amazon首次将协同过滤技术应用于实际推荐系统,并开创了电子商务领域的推荐应用。2006年,由Netflix公司发起的推荐系统竞赛,为推荐系统领域的研究和应用提供了重要的契机。2010年,Google采用了基于内容的推荐方法,并开发了面向新闻的个性化推荐系统,引领了推荐系统应用的新潮流。最初,推荐系统是在电子商务网站中为用户提供商品信息和购买建议,类似于模拟销售人员的角色,帮助用户完成购买过程[5]。到现在,推荐系统主要致力于实现个性化推荐的目标,它通过对用户的兴趣特点和历史浏览行为进行建模,以此来描绘用户的喜好特征,并向用户推荐那些最有可能引起他们兴趣的信息[6]。
推荐算法是推荐系统的核心,对推荐系统的成功与否起着至关重要的作用。在国内外很多热门应用中如亚马逊、YouTube、抖音、美团、淘宝、拼多多等,推荐算法都是其获得成功的重要保障。根据推荐算法的发展规律和技术特点,可以将其大致分为两类:传统推荐算法和基于深度学习的推荐算法。在推荐系统的发展历程中,传统的推荐算法主要包括基于内容的推荐算法、基于协同过滤的推荐算法和混合推荐算法三大类,这些算法发挥了至关重要的作用。深度学习技术的快速发展已经成为推荐系统研究的热点,越来越多的学者和研究者开始探索如何将深度学习技术应用于推荐系统,这已经成为推荐系统领域的主流研究方向,并在推动推荐系统技术的革新方面发挥着重要作用。
2推荐算法
2.1 传统推荐算法
目前传统的推荐算法主要分为两类:基于协同过滤和内容的推荐算法。协同过滤推荐算法[7]是目前应用最为广泛的推荐算法之一,其基于用户行为数据进行推荐,通过寻找与目标用户兴趣相似的其他用户或物品,来实现个性化的推荐服务。协同过滤的推荐算法又主要分为基于邻域的推荐算法和基于模型的推荐算法两类。基于内容的推荐算法(Content-based Recommendation algorithms,CB)[8]与协同过滤算法的实现原理不同,它通过提取物品的内容特征,利用这些特征来计算物品之间的相似度,从而推荐与用户过去喜欢的物品相似的物品。在算法中,对于每个物品,都需要从中提取出一些特征信息,以手机为例,手机的品牌、性能、颜色、价格等都是物品的特征,物品的特征可以通过商品自身信息、人工标签、用户评论等方式获取。
2.2 混合推荐算法
混合推荐算法(Hybrid Recommendation)[9]是指将不同的推荐算法进行组合,以期望得到更好的推荐效果的一种推荐算法。其主要思想是将多个推荐算法的推荐结果进行融合,以弥补单一推荐算法的不足。例如:协同过滤和内容推荐相结合的方法,这种混合推荐算法旨在克服协同过滤算法在数据稀疏性和冷启动问题上的不足,同时利用内容推荐算法的优点来提高推荐系统的准确性和多样性。混合推荐的目的就是互相补充,利用各自的优势,提高推荐的准确性。常见的混合推荐算法包括加权型、切换型、层叠型[10]。
(1)加权型:加权式混合推荐通过对多个算法的输出赋予权重,根据不同权重加权求和得到最终结果。基本方法是,先把不同的推荐算法赋予相同的权重,然后根据推荐结果的准确性进行权重的调整,最后得到新的推荐列表。
(2)切换型:根据问题背景和实际情况,灵活采用不同的推荐算法。举个例子,在给用户进行商品推荐的时候,系统首先使用基于协同过滤的算法,推荐与用户之前喜欢的商品相似的商品。但是,如果用户在一段时间内没有对推荐的商品做出任何反应,系统会切换到基于内容的算法,为用户推荐与用户最近买过的商品相似的商品。这样,系统可以更好地适应用户的兴趣变化,提高推荐的准确性。
(3)层叠型:这种方式需要更加复杂的计算和处理,层叠型是将前一种算法输出的结果作为后一种算法的输入,有着明显的层次结构。这种混合推荐算法的组合难度较高,但是性能表现要优于其他几种混合推荐算法策略。
3 基于编码器增强推荐算法
基于编码器的推荐模型,通过Transformer编码器对嵌入特征进行编码,利用双线性函数生成不同特征对的不同特征相似度,从编码器生成的嵌入有利于进一步的特征交互,从而提高推荐精度。在DeepFM模型的基础之上引入Transformer编码器,编码器为FM和DNN生成更好的上下文对齐向量。编码器在自然语言处理中可以有效地进行上下文词嵌入的积累和提取,因此在CTR的整体表示学习中会非常有用。另外,在多头注意力机制的不同子空间中,特征相似度函数是统一的缩放点积函数,不同子空间的特征相似度也可以是个性化的,因此为编码器添加了双线性机制,替换注意力机制中的点积函数。通过双线性函数计算不同特征之间的相关性,为模型提供了可解释性。
3.1 DeepFM和Transformer模型
DeepFM模型的整体结构如图1-1所示,包括FM和DNN两个模块。左边的FM和右边的DNN共享相同的Embedding层的输入。左侧的FM除了从输入层得到一阶特征的相关性,还从不同特征域的Embedding向量进行两两交互。右侧的DNN对特征Embedding进行了高阶交互,最后将FM的输出与Deep部分的输出一起送入最后的输出层,参与最后的目标拟合。
Transformer模型的整体架构,包括一个编码器和一个解码器,其中编码器和解码器内部是由多头注意力机制和前馈神经网络堆叠组成。编码器的结构如图 1-2所示。每层编码器有两个子层,第一层是多头注意力机制,第二层是完全连接的前馈网络,并且每个子层都要经过残差连接和层归一化。注意力机制通过注意力汇聚,将查询(query)和键(key)结合在一起,对不同的键施加不同的权重,实现对值(value)的选择倾向。这种方式可以较好地汇聚上下文信息,帮助神经网络抽取特征,让网络给予那些比较重要的特征更大的权重。
3.2 基于编码器增强的推荐算法
在DeepFM模型的嵌入层之后加入双线性编码器,编码器生成的嵌入有利于模型后面的特征交互。EnDeepFM模型的结构如图1-3所示,它由五个组件组成:嵌入层,编码器,FM,DNN和输出层。工作流程如下:首先,嵌入层将输入特征投影到低维空间中;然后编码器通过多头注意力机制自适应的更新嵌入结果相对于来自其他特征的信息;接下来,将编码器的输出馈送到FM和DNN分别进行低阶和高阶的特征交互。最后将FM的输出与DNN部分的输出一起送入最后的输出层,进行目标预测。
通过利用嵌入层和编码器层来构建EnDeepFM模型,借助该模型损失函数对公开数据集sample Criteo和MovieLens-1M进行试验分析,对比其他模型发现在DeepFM模型的基础引入双线性编码器,提出了EnDeepFM模型,编码器对嵌入特征进行编码,利用双线性方法来生成关于不同特征对的不同相似性函数,从编码器生成的嵌入有利于进一步的特征交互。最后,在两个公开数据集上进行对比实验,验证了EnDeepFM模型的有效性。
4 个性化商品推荐系统设计
借助基于编码器增强的推荐模型进行部署,以证明模型的有效性和可行性。系统中包括个性化推荐功能和非个性化推荐功能,下面将对个性化商品推荐系统的需求和设计进行介绍,最后对系统在不同场景下给出的推荐结果进行展示和分析。
4.1 需求分析
首先进行个性化商品推荐系统的需求分析。个性化商品推荐系统的主要目的是发现用户的潜在需求,减少用户对商品的检索时间,提高用户的满意度和购买率。商品推荐系统主要包含用户功能、后台管理功能和商品推荐功能。主要功能是对登录系统的用户进行商品推荐,用户完成对商品的浏览和购买,后台对购买的商品进行管理。
正常分析用户需求主要分为三类:用户功能需求、管理功能需求及推荐模型功能需求。(1)用户功能需求分析是指普通用户第一次进入系统要进行注册,登录系统之后,推荐系统会为用户提供购买商品的各种功能。(2)管理功能是方便管理员在后台对商品进行管理,主要包括以下功能:管理人员登录、商品管理、订单管理、用户管理和数据统计。(3)在对训练数据完成收集和处理之后,需要对收集的数据进行特征的提取,然后选择合适的推荐算法,开始进行模型的训练和部署,完成推荐模型的搭建。
4.2 系统结构
通过对推荐系统业务逻辑架构的调研,本系统采用三层架构,分为表示层、业务逻辑层和数据访问层组成。该架构结构分明,代码耦合性低复用性强,是系统开发中常用的架构。本系统整体框架如下图1-4所示。推荐系统的表示层是对用户进行一个图形化界面展示,方便用户对商品进行浏览查看。用户通过私人账号进行系统登录,可以在系统界面上进行商品的浏览查看、收藏和购买等行为,系统会对用户和商品的交互行为进行保存,供推荐引擎进行数据建模,根据推荐引擎得到用户偏好并更新数据库。业务逻辑层主要负责表示层和数据层的交互,逻辑层接收来自表示层的访问请求,逻辑层对请求进行解析处理,然后对数据层进行数据查询,最后将查询到的数据反馈到用户界面。数据访问层主要是用于信息的存储和查询,通过搭建的推荐引擎对存储的数据进行建模,不断更新用户的推荐列表。
4.3 系统展示
用户或管理员通过输入账号和密码进入各自页面。当用户进入主页推荐页面后,若存在历史交互记录,则可以对用户进行个性化推荐服务。对此商品个性化推荐界面根据数据库中存储的用户历史行为记录,为用户生成热门推荐列表与个性推荐界面(猜你喜欢),用户可以根据喜好进行选择。同时在后台管理系统会出现相关记录,因而后台管理的主要功能有商品管理、订单管理、用户管理和数据统计。其中商品管理负责对网站中的商品进行上下架的管理。订单管理可以查看、编辑、取消订单,管理订单状态、物流信息等。用户管理可以查看、编辑、删除用户信息,管理用户等级、积分、收货地址等。数据统计通过查看商品销售情况、订单数量、用户活跃度等数据,进行数据分析和决策。
5 结语
在大数据时代,信息的爆炸式增长给人们的生活带来了极大的便利,但同时也带来了信息过载的问题。推荐系统的出现逐渐缓解了这一难题。例如,在电子商务中,推荐系统可以根据用户的兴趣特点和历史浏览行为向其推荐最有可能感兴趣的商品,从而提高用户的购买率和满意度。此外,推荐系统的出现得益于大数据技术的发展。根据统计,目前全球使用推荐系统的企业和平台数量已经达到数以万计,涉及电子商务、社交网络、新闻媒体等各个领域。对此文中阐述了相关推荐算法和推荐系统,并以基础系统构建了新系统来推动商品化个性推荐。为后续电商的发展提供了有力基础理论研究。
参考文献:
[1] 黄立威, 江碧涛, 吕守业, 等. 基于深度学习的推荐系统研究综述[J]. 计算机学报, 2018, 41(07): 1619-1647.
[2] Bawden D, Robinson L. The dark side of information: overload, anxiety and other paradoxes and pathologies[J]. Journal of Information Science, 2009, 35(2): 180-191.
[3] Resnick P, Varian H R. Recommender systems[J]. Communications of the ACM, 1997, 40(3): 56-58.
[4] Linden G, Smith B, York J. Amazon. com recommendations: Item-to-item collaborative filtering[J]. IEEE Internet Computing, 2003, 7(1): 76-80.
[5] 刘玮. 电子商务系统中的信息推荐方法研究[J]. 情报科学, 2006, 24(2):300-303.
[6] 张宇航, 姚文娟, 姜姗. 个性化推荐系统综述[J]. 价值工程, 2020, 39(02):287-292.
[7] Nakamura A. Collaborative filtering using weighted majority prediction algorithms[C]//International Conference on Machine Learning. 1998:395-403.
[8] 陈洁敏, 汤庸, 李建国, 等. 个性化推荐算法研究[J]. 华南师范大学学报: 自然科学版, 2014, 46(5): 8-15.
[9] Burke R. Hybrid web recommender systems[J]. The Adaptive Web: Methods and Strategies of Web Personalization, 2007, 42(3):377-408.
[10] 张玉洁, 董政, 孟祥武. 个性化广告推荐系统及其应用研究[J]. 计算机学报, 2021, 44(03): 531-563.




京公网安备 11011302003690号