tokenpocket最新版app|智能推荐
推荐算法分类:协同过滤推荐、基于内容推荐、基于知识推荐、混合推荐 - 知乎
推荐算法分类:协同过滤推荐、基于内容推荐、基于知识推荐、混合推荐 - 知乎首发于推荐搜索广告切换模式写文章登录/注册推荐算法分类:协同过滤推荐、基于内容推荐、基于知识推荐、混合推荐小小磊本文总结了近些年被广泛接受的推荐算法,主要包括以下四种主流的推荐算法:协同过滤推荐、基于内容推荐、基于知识推荐、以及混合推荐。下面将分别介绍这四种方法的基本理论框架。协同过滤推荐协同过滤推荐的原理协同过滤推荐的主要思想是,利用已有用户群过去的行为预测当前用户最可能喜欢哪些物品。协同过滤推荐的输入与输出输入:“用户-物品”评分矩阵输出:一种是用户对某个物品喜欢或不喜欢程度的预测数值;另一种是 n 项推荐物品的列表协同过滤推荐的分类协同过滤推荐大致可以分为:基于邻域的推荐和基于模型的推荐。前者将所有数据记忆到存储体中。后者(离线)做数据降维,抽象出特征,运行时直接用特征。基于邻域的推荐:基于用户的协同过滤:给用户推荐和他兴趣相似的其他用户喜欢的物品基于物品的协同过滤:给用户推荐和他之前喜欢的物品相似的物品基于模型的推荐:使用部分机器学习算法,找出用户与项的相互作用模型,从而找出数据中的特定模式。如关联模型,隐语义模型、图模型、混聚类模型、分类模型、回归模型、矩阵分解模型、神经网络模型、合模型、深度学习模型等。基于用户的协同过滤推荐步骤:1、找到和目标用户兴趣相似的用户集合。 2、找到这个集合中的用户喜欢的,且目标用户没有听说过的物品推荐给目标用户。 缺点:1、UserCF 需要维护一个用户兴趣相似度的矩阵,随着用户数目增多,维护用户兴趣相似度矩阵的代价越大。计算用户兴趣相似度矩阵的运算时间复杂度和空间复杂度的增长和用户数的增长近似于平方关系。2、当数据发生变化的时候,之前计算出的用户之间的相似度不稳定。3、基于用户的协同过滤很难对推荐结果作出解释。实用场景 —— 新闻推荐:1、个性化新闻推荐更加强调抓住新闻热点,热门程度和时效性是个性化新闻推荐的重点,而个性化相对于这两点略显次要。2、新闻的更新非常快,物品相关度的表也需要很快更新,虽然 UserCF 对于新用户也需要更新相似度表,但在新闻网站中,物品的更新速度远远快于新用户的加入速度,而且对于新用户,完全可以给他推荐最热门的新闻。举例:基于用户的协同过滤推荐简单的说,如果 A、B 两个用户都购买了 x、y、z 三本图书,并且给出了 5 星的好评。那么 A 和 B 就属于同一类用户。可以将 A 看过的图书 w 也推荐给用户 B。本示例中,5 个用户分别对 5 件商品进行了评分。1、寻找偏好相似的用户本示例中,我们通过皮尔逊相关度评价对用户进行分组,并推荐商品。皮尔逊相关系数的结果是一个在-1与1之间的系数(该系数用来说明两个用户间联系的强弱程度:0.8-1.0 极强相关,0.6-0.8 强相关,0.4-0.6 中等程度相关,0.2-0.4 弱相关,0.0-0.2 极弱相关或无相关)。于是我们获得了用户间的相似度数据。可以看到用户 A&B,C&D,C&E 和 D&E 之间相似度较高。下一步,我们可以依照用户间的相似度对用户进行商品推荐。2、为相似的用户提供推荐物品本示例中,我们在为相似的用户提供推荐物品时,采用加权排序推荐。当我们需要对用户 C 推荐商品时,首先我们检查之前用户间的相似度列表,发现用户 C 和用户 D 和 E 的相似度较高。我们提取了用户 D 和用户 E 评价过的另外 6 件商品(商品 A —— 商品 F)。并对不同商品的评分进行相似度加权。按加权后的结果对 6 件商品进行排序,然后推荐给用户 C。这样,用户 C 就获得了与他偏好相似的用户 D 和 E 评价的商品。基于物品的协同过滤推荐步骤:1、计算物品之间的相似度。 2、根据物品的相似度和用户的历史行为给用户生成推荐列表。缺点:1、ItemCF 需要维护一个物品相似度矩阵,随着物品数目增多,维护物品相似度矩阵的代价越大。实用场景 —— 图书、电子商务和电影网站:1、在这些网站中,用户的兴趣是比较固定和持久的。这些系统中的用户大都不太需要流行度来辅助他们判断一个物品的好坏,而是可以通过自己熟悉领域的知识自己判断物品的质量。2、这些网站的物品更新速度不会特别快,一天一次更新物品相似度矩阵对它们来说不会造成太大的损失,是可以接受的。举例:基于物品的协同过滤推荐简单的说,如果用户 A 同时购买了商品 x 和商品 y,那么说明商品 x 和商品 y 的相关度较高。当用户 B 也购买了商品 x 时,可以推断他也有购买商品 y 的需求。本示例中,我们将表格中的用户和商品的位置进行了互换,5 个用户分别对 5 件商品进行了评分。1、寻找相似的物品本示例中,我们通过皮尔逊相关度评价对商品进行分组,并推荐商品。皮尔逊相关系数的结果是一个在-1与1之间的系数(该系数用来说明两个用户间联系的强弱程度:0.8-1.0 极强相关,0.6-0.8 强相关,0.4-0.6 中等程度相关,0.2-0.4 弱相关,0.0-0.2 极弱相关或无相关)。于是我们获得了物品间的相似度数据。可以看到商品 3&4,商品 3&5 和商品 4&5 之间相似度较高。下一步,我们可以依照商品间的相似度对用户进行商品推荐。2、为用户提供基于相似物品的推荐本示例中,我们在为用户提供推荐相似的物品时,采用加权排序推荐。当我们需要对用户 C 基于商品 3 推荐商品时,首先我们检查之前商品间的相似度列表,发现用户 C 已经购买过的商品 4、5 与新商品 A、B、C 之间的相似度较高。我们将用户 C 对商品 4、5 的评分作为权重。对商品 A、B、C 进行加权排序。用户 C 评分较高并且与之相似度较高的商品被优先推荐。基于模型的协同过滤推荐基于样本的用户喜好信息,训练一个推荐模型,然后根据实时的用户喜好的信息进行预测,计算推荐。协同过滤推荐的优缺点优点:1、模型通用性强:模型不需要太多对应数据领域的专业知识。2、简单易用:工程实现简单且效果不错。缺点:1、用户的冷启动:当没有新用户任何数据的时候,无法较好的为新用户推荐物品。2、物品的冷启动:当新物品没有用户行为数据是,无法通过协同过滤的方式进行推荐。 3、没有考虑到情景的差异:比如根据用户所在的场景进行推荐。4、无法得到一些小众的独特喜好:这块是基于内容的推荐比较擅长的。 基于内容推荐基于内容推荐的原理基于内容推荐的工作原理是,评估用户还没看到的物品与当前用户过去喜欢的物品的相似程度。基于内容推荐的过程基于内容推荐的过程一般包括以下三步:1、给出物品表示:为每个物品抽取出一些特征来表示此物品;2、学习用户偏好:利用一个用户过去喜欢(及不喜欢)的物品的特征数据,来学习出此用户偏好;3、生成推荐列表:根据候选物品表示和用户偏好,为该用户生成其最可能感兴趣的 n 个物品。举例说明(个性化阅读):第一步,对于个性化阅读来说一个 item 就是一篇文章,我们首先要从文章内容中抽取出代表它们的属性。常用的方法就是利用出现在一篇文章中的词来代表这篇文章,而每个词对应的权重往往使用信息检索中的 tf-idf 来计算。利用这种方法,一篇抽象的文章就可以使用具体的一个向量来表示了。第二步就是根据用户过去喜欢什么文章来产生刻画此用户喜好的 profile 了,最简单的方法可以把用户所有喜欢的文章对应的向量的平均值作为此用户的 profile。第三步,在获得了一个用户的 profile 后,CB 就可以利用所有 item 与此用户 profile 的相关度对他进行推荐文章了。一个常用的相关度计算方法是 cosine。最终把候选 item 里与此用户最相关(cosine值最大)的 N 个 item 作为推荐返回给此用户。第一步:给出物品表示 - 基于向量空间模型的方法文本表示模型有基于布尔模型、基于向量空间模型、基于主题模型、基于神经网络的方法等。下面介绍一下基于向量空间模型的方法。基于向量空间模型的方法是将文本表示成实数值分量所构成的向量,一般而言,每个分量对应一个词项,相当于将文本表示成空间中的一个点。向量不仅可以用来训练分类器,而且计算向量之间的相似度可以度量文本之间的相似度。最常用的是 TF-IDF 计算方式,即向量的维度对应词表的大小,对应维度使用 TF-IDF 计算。TF(term-frequence)-IDF(inverse documents frequence),词频-反文档频率。文本文档可以通过 TF-IDF 转换成多维欧几里得空间中的向量,空间的维度对应文档中出现的关键词。给定文档在每维(即每个词)的坐标由两个子量的乘积得出:词频和反文档频率。TF,词频。描述某个词在一篇文档中出现的频繁程度。考虑到文档长度,为了阻止更长的文档得到更高的相关度权值,必须进行文档长度的某种归一化。其中一种简单方法是将词出现的实际次数比上文档中其他关键词出现的最多次数,即 TF(i,j) = freq(i,j)/maxOthers(i,j),其中 TF(i,j) 为文档 j 中关键词 i 的归一化词频值,freq(i,j) 为 i 在 j 中出现的绝对频率,maxOthers(i,j) 为 j 中其他关键词出现的最多次数。IDF,反文档频率。组合了词频后的第二个衡量值,旨在降低所有文档中几乎都会出现的关键词的权重。其思想是,那些常见的词语对区分文档没有用,应该给那些仅出现在某些文档中的词更高的权值。IDF的计算方式为 IDF(i) = log(N/n(i)),其中 IDF(i) 为关键词 i 的反文档频率,N 为所有可推荐文档的数量,n(i) 为 N 中关键词 i 出现过文档的数量。文档 j 中关键词 i 的组合 TF-IDF 权值可以计算为这两个子量的乘积,即 TF-IDF(i,j) = TF(i,j) * IDF(i)。向量空间模型的优点是简单明了,向量维度意义明确,效果不错。但也存在明显的缺点,其一是维度随着词表增大而增大,且向量高度稀疏;其二是无法处理“一义多词”和“一词多义”问题。针对以上问题,有人提出很多改进方法,如删除停用词并还原词干、通过特征选择选择可用词子集、通过矩阵分解对高维稀疏矩阵降维等。第二步:学习用户偏好 - 基于最近邻模型的方法假设某用户已经对一些物品给出了他的喜好判断。那么这一步要做的就是通过该用户过去的这些喜好判断为他产生一个模型。之后我们就可以根据此模型来判断该用户是否会喜欢一个新的物品。所以,这类问题可以看作是一个典型的有监督分类问题,理论上机器学习里的分类算法都可以照搬进这里。下面介绍一下基于最近邻模型的方法。在基于最近邻模型的方法中,对于一个新的物品 item,最近邻方法首先找用户 u 已经评判过并与此新物品 item 最相似的 k 个物品,然后依据用户 u 对这 k 个物品的喜好程度来判断其对此新物品 item 的喜好程度。对于这个方法,比较关键的可能就是如何通过物品的属性向量计算物品之间的两两相似度。如果使用向量空间模型来表示物品的话,相似度计算可以使用余弦相似度。基于最近邻模型的方法的优点是,易于实现,快速适应变化,相对少的数据效果也不错;缺点是,预测精度低。第三步:生成推荐列表如果上一步学习用户偏好中使用的是分类模型(如朴素贝叶斯算法),那么我们只要把模型预测的用户最可能感兴趣的 n 个物品作为推荐结果返回给用户即可。而如果上一步学习用户偏好中使用的是直接学习用户偏好的方法(如Rocchio算法),那么我们只要把与用户偏好最相关的 n 个物品作为推荐结果返回给用户即可,其中的用户偏好与物品表示的相关性可以使用相似度度量(如余弦相似度)获得。基于内容推荐的优缺点优点:1、用户之间的独立性:既然每个用户的用户偏好都是依据他本身对物品的喜好获得的,自然就与他人的行为无关。而协同过滤推荐刚好相反,协同过滤推荐需要利用很多其他人的数据。基于内容推荐的这种用户独立性带来的一个显著好处是别人不管对物品如何作弊(比如利用多个账号把某个产品的排名刷上去)都不会影响到自己。2、好的可解释性:如果需要向用户解释为什么推荐了这些产品给他,你只要告诉他这些产品有某某属性,这些属性跟你的品味很匹配等等。3、新的物品可以立刻得到推荐:只要一个新的物品加进物品库,它就马上可以被推荐,被推荐的机会和老的物品是一致的。而协同过滤推荐对于新的物品就很无奈,只有当此新的物品被某些用户喜欢过(或打过分),它才可能被推荐给其他用户。所以,如果一个纯协同过滤推荐的推荐系统,新加进来的物品就永远不会被推荐。缺点:1、物品的特征抽取一般很难:如果系统中的物品是文档,那么我们现在可以比较容易地使用信息检索里的方法来“比较精确地”抽取出物品的特征。但很多情况下我们很难从物品中抽取出准确刻画物品的特征,比如电影推荐中物品是电影,社会化网络推荐中物品是人,这些物品属性都不好抽。其实,几乎在所有实际情况中我们抽取的物品特征都仅能代表物品的一些方面,不可能代表物品的所有方面。这样带来的一个问题就是可能从两个物品抽取出来的特征完全相同,这种情况下基于内容的方法就完全无法区分这两个物品了。2、无法挖掘出用户的潜在兴趣:既然基于内容推荐只依赖于用户过去对某些物品的喜好,它产生的推荐也都会和用户过去喜欢的物品相似。如果一个人以前只看与推荐有关的文章,那基于内容推荐只会给他推荐更多与推荐相关的文章,它不会知道用户可能还喜欢数码。3、无法为新用户产生推荐:新用户没有喜好历史,自然无法获得他的用户偏好,所以也就无法为他产生推荐了。当然,这个问题协同过滤推荐也有。基于内容推荐的现状基于内容推荐应该算是第一代的个性化应用中最流行的推荐算法了。但由于它本身具有某些很难解决的缺点(如上面介绍的第1点),再加上在大多数情况下其精度都不是最好的,目前大部分的推荐系统都是以其他算法为主(如协同过滤推荐),而辅以基于内容推荐以解决主算法在某些情况下的不精确性(如解决新物品问题)。但基于内容推荐的作用是不可否认的,只要具体应用中有可用的属性,那么基本都能在系统里看到基于内容推荐的影子。组合基于内容推荐和其他推荐算法的方法很多,最常用的可能是用基于内容推荐来过滤其他算法的候选集,把一些不太合适的候选(比如不要给小孩推荐偏成人的书籍)去掉。基于知识推荐基于知识推荐的原理协同过滤系统将用户评分作为知识源,向用户推荐物品。因此这个系统不需要输入并维护附加的信息。基于内容系统的主要知识源包括类别和体裁信息,还有自动从物品的描述中抽取出的关键词。因此与协同过滤系统系统类似,这个系统可以以相对较小的代价获取和维护这些知识。二者各有优势,但在很多情况下并非最好选择。例如用户不会频繁购买房屋,这时纯粹的协同过滤系统会由于评分数据很少而效果不好;再如用户对计算机的偏好会随着生活方式或经济状况的改变而改变,这时5年前对计算机的评分对基于内容推荐来说就不太合适了;又如用户在购买汽车时希望能明确定义他们的需求,而这些需求的形式化处理并不是纯粹协同过滤和基于内容推荐的系统所擅长解决的。基于知识的推荐系统可以帮我们解决上面提到的问题。推荐结果依赖用户需求与产品之间相似度的形式,或者是根据明确的推荐规则。Burke(2000)及 Felfernig and Burke(2008)将基于知识的推荐系统定义为依赖协同过滤和基于内容方法没有用到的信息源的推荐系统。基于知识推荐的分类基于知识的推荐系统的两种基本类型是:基于约束的推荐和基于实例的推荐。这两种方法在推荐过程上比较相似:用户必须指定需求,然后系统设法给出解决方案。如果找不到解决方案,用户必须修改需求。此外,系统还需给出推荐物品的解释。这两种方法的不同之处在于:如何使用所提供的知识。基于实例的推荐系统着重于根据不同的相似度衡量方法检索出相似的物品,而基于约束的推荐系统则依赖明确定义的推荐规则集合。知识表示方法和推理一般来说,基于知识的推荐系统依赖物品特性的详细知识,用户的需求可能会表示成物品特性的需求值或阈值范围。基于约束的推荐:一般可以表示为由约束求解器解决的约束满足问题,或者是通过数据库引擎执行并解决的合取查询形式。基于实例的推荐:主要利用相似度衡量标准从目录中检索物品。基于约束的推荐系统的交互基于知识的会话式推荐系统的一般交互过程如下:1、用户指定自己的最初偏好;2、当收集了足够有关用户的需求和偏好的信息,会提供给用户一组匹配的产品。用户可以选择要求系统解释为什么会推荐某个产品;3、用户可能会修改自己的需求。尽管这种通用的用户交互方法一开始应用时非常简单,但在实际应用中必须要有一些更加精密的交互模式来支持推荐过程中的终端用户。如果目录中没有一个物品能满足用户的所有需求,会话式推荐系统需要能够智能地帮助终端用户解决问题。下面给出了一些能够帮助用户与基于约束推荐应用交互所用到的不同技术:1、默认设置:帮助用户说明需求的重要方法。2、处理不满意的需求和空结果集:可以通过逐渐、自动的放宽推荐问题的限制,直到找到对应的解决方案。3、提出对未满足需求的修改建议:对已有的需求集做出适当的调整。4、对基于物品/效用推荐结果的排序:由于首位效应,用户会更关注并选择列表开头的物品,根据物品对用户的效用进行排序会显著提高推荐应用的信任度和用户的购买意愿。在基于知识的会话式推荐系统中,物品排序根据的是多属性效用理论,依据每个物品对用户的效用来评价。基于实例的推荐系统的交互与基于约束的推荐系统类似,早期的基于实例的推荐系统采用的也是纯粹基于查询的方法。用户需要指定(经常是反复指定)他们的需求,直到发现目标物品。这种反复修改十分乏味,而且需要专业的领域知识才能弄懂物品之间的关系属性。这种缺陷让人们提出了基于浏览的方法来检索物品,评价就是一种非常有效的导航方式。评价的基本思想是:用户以当前待审核物品(录入物品或推荐物品)未满足的目标来指明他们的修改要求。举个例子,如果当前展示的数码相机价格太高,用户就会给出希望更便宜的评价;如果用户想要更高分辨率的数目相机,就会选择对应的更高像素的评价。基于实例的推荐系统的最新进展是有效整合了基于查询和基于浏览的物品检索。一方面,评价有助于在物品集合内有效地引导用户;另一方面,基于相似度的实例检索有助于识别最相似的物品。基于评价的推荐系统允许用户很方便地表达自己的偏好,而不用被强制指明物品属性的具体值。混合推荐混合推荐的原理前面讨论了三种主流的推荐方法,各有利弊,为扬长避短,在实际中常常采用混合推荐。下图把推荐系统看成一个黑盒,它能够将输入数据转换成物品的有序列表再输出。输入数据类型可能包含用户记录和上下文参数、群体数据、产品特征以及知识模型。混合推荐的目标是构建一种混合系统,即能结合不同算法和模型的优点,又能克服其中的缺陷。推荐理论框架重点讨论三种基本的推荐理论框架:协同过滤、基于内容和基于知识。协同过滤:假设人以类聚,大家有着相似的行为那么需求和偏好也差不多。需要的输入数据包括用户记录和上下文参数、群体数据。基于内容:遵循以不变应万变,根据用户过去喜欢的物品推荐相似的物品。需要的输入数据包括用户记录和上下文参数、产品特征。基于知识:认为会有额外的信息源,即显式的个性化知识。需要的输入数据包括用户记录和上下文参数、产品特征、知识模型。因此,选择哪种推荐理论框架决定了要输入数据的类型。系统的混合设计Burke 的分类方法(2002b)区分出了七种不同的混合策略。从更综合的角度来看,这七种策略可以概括成三种基本设计思路:整体式、并行式和流水线式。并行式和流水线式都具有两个以上的推荐单元,它们的推荐结果被组合起来。整体式混合设计与之不同,它只包含一个推荐单元,通过预处理和组合多个知识源从而将多种方法整合在一起。整体式:是指将几种推荐策略整合到一个算法中实现的混合设计。根据 Burke(2002b)的分类方法,特征组合和特征补充都可以纳入这个类别。并行式:多个推荐系统独立运行分别产生推荐列表,再利用一种特殊的混合机制将它们的输出结果整合在一起。Burke(2002b)详细说明了交叉、加权、和切换策略。不过多推荐列表的其他一些组合策略可能也适用,比如多数投票机制。流水线式:将多个推荐系统按照流水线架构连接起来,前一个推荐系统的输出变成后一个推荐系统的输入部分。当然,后面的推荐单元也可以选择使用部分原始输入数据。Burke(2002b)定义的串联和分级混合设计就是这种流水线架构的实例。END公众号:TSGshare欢迎留言批评指正!编辑于 2021-03-26 10:11推荐算法赞同 47111 条评论分享喜欢收藏申请转载文章被以下专栏收录推荐搜
智能推荐算法演变及学习笔记(一):智能推荐算法综述 - FinTecher - 博客园
智能推荐算法演变及学习笔记(一):智能推荐算法综述 - FinTecher - 博客园
会员
周边
新闻
博问
AI培训
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式 ...
退出登录
注册
登录
FinTecher
座右铭:认知、思考、行动
博客园
首页
新随笔
联系
订阅
管理
智能推荐算法演变及学习笔记(一):智能推荐算法综述
一、基于内容的智能推荐:最古老的智能推荐方案!二、基于协同过滤的智能推荐:最流行的智能推荐方案! 三、混合推荐 四、智能推荐系统可能存在的问题 五、智能推荐的企业级应用
【说在前面】本人博客新手一枚,象牙塔的老白,职业场的小白。以下内容仅为个人见解,欢迎批评指正,不喜勿喷![握手][握手]
一、基于内容的智能推荐:最古老的智能推荐方案!
1. 定义
根据用户历史喜欢的item,为用户推荐与其内容相似的item。
2. 主要步骤
(1)从用户每个历史item的内容中抽取出一些特征
结构化数据:直接用即可
非结构化数据:转化为结构化数据后再使用(例如:针对文本数据的向量空间模型、TF-IDF等)
(2)利用用户历史喜欢或不喜欢的item特征集合,学习出用户的兴趣特征表示
可以直接选择item的相似度衡量方法:欧几里得距离(适用于结构化数据)、余弦相似性(适用于非结构化数据转化后的向量表示)等
可以采用机器学习算法进行有监督训练:线性回归、最近邻、朴素贝叶斯、决策树、神经网络等
(3)比较用户的兴趣特征与候选item的特征,选择相关性前Top-n的item进行推荐
如果2中直接采用相似度衡量方法:只要把与用户兴趣特征最相关的n个item作为推荐返回给用户即可
如果2中采用机器学习算法:只要把模型预测的用户最可能感兴趣的n个item作为推荐返回给用户即可
3. 优缺点
(1)优点
不需要其它用户的数据,没有物品冷启动问题和数据稀疏问题
能推荐新的或不是很流行的项目,没有新项目问题
能为具有特殊兴趣爱好的用户进行推荐
可以通过推荐项目的内容特征,解释其推荐理由
(2)缺点
存在用户冷启动问题
对item内容的特征抽取并不容易实现
将各用户独立,只能推荐用户历史感兴趣的item,用户的潜在喜好无法挖掘
二、基于协同过滤的智能推荐:最流行的智能推荐方案!
1. 基于内存的协同过滤方法
(1)基于用户的推荐:主要考虑用户之间的相似度,将相似用户评分Top-n的物品推荐给用户
(2)基于物品的推荐:主要考虑物品之间的相似度,将与用户喜好物品相似度Top-n的物品推荐给用户
(3)优缺点
和基于内容的推荐方法相比,该协同过滤具有如下的优点:
能够过滤难以进行机器自动内容分析的信息,如艺术品、音乐等
能够共享其他用户的经验,避免了内容分析的不完全和不精确
能够有效使用其他相似用户的反馈信息,加快个性化学习的速度
具有推荐新信息的能力,可以发现用户潜在的但自己尚未发现的兴趣偏好
但该协同过滤仍有许多的问题需要解决:
存在冷启动问题和数据稀疏问题
商品、用户越多,协同过滤越复杂,可扩展问题
不能为具有特殊兴趣爱好的用户进行推荐(找不到相似用户)
2. 基于模型的协同过滤方法:最主流的智能推荐方案!
(1)基于关联规则的推荐:主要方法是从 Apriori 和 FP-Growth 两个算法发展演变而来(计算复杂度过大)
(2)基于矩阵分解的推荐:主要方法包括SVD分解及其变种、分解机、张量分解等(都未解决数据稀疏问题和冷启动问题)
(3)基于隐语义模型的推荐:主要方法包括隐性语义分析LSA和隐含狄利克雷分布LDA等。(主要是基于用户的nlp语义分析进行相关推荐)
(4)基于机器学习的推荐(参考数据挖掘项目全流程介绍)
基于聚类算法的推荐:k-means、层次聚类等
基于分类算法的推荐:最近邻、朴素贝叶斯、决策树等
基于回归算法的推荐:线性回归、逻辑回归等
基于集成学习的推荐:gbdt、xgboost、lightgbm等
(5)CTR预估模型演变之路(手动划重点)
LR/GBDT/xgboost:机器学习算法的直接使用
FM/FFM:FM在LR的基础上,考虑了特征间的二次交叉;而FFM则是在FM的基础上,考虑了特征交叉的field特点
GBDT+LR/FM/FFM:GBDT模型能够学习高阶非线性特征组合、LR/FM/FFM易于处理大规模稀疏数据
MLR:等价于聚类+lr,先聚成m类,然后每个聚类单独训练一个LR,分而治之
DNN/wide & deep/deepFM/NFM/DCN等(引入深度学习):都是在高阶特征的提取上下了不少功夫
wide & deep:可以看作是 DNN 和特征工程的融合
deepFM/NFM:可以看作是FM、FFM和DNN的融合
DCN :cross网络是FM在高阶特征组合的推广,不需要特征工程
后续还有引入注意力机制、强化学习等的智能推荐方法
双塔模型DSSM:两侧分别对{用户,上下文} 和 {物品} 进行建模
(6)基于图模型的推荐
SimRank系列算法和马尔科夫模型算法:基于用户-物品二分图的拓扑结构信息来衡量任意两个对象间的相似程度
基于知识图谱的推荐:
基于特征的推荐方法:主要是从知识图谱中抽取用户和物品的属性作为特征,放入到传统的模型中(只引入了实体特征,没有引入关系特征)
基于路径的推荐方法:将知识图谱视为一个异构信息网络(用户-物品),然后构造物品之间的基于meta-path的特征(meta-path是连接两个实体的一条特定的路径)
知识图谱特征学习:基于距离的翻译模型追求h + r = t(TransE、TransH、TransR等)、基于语义的匹配模型将h/r/t输入网络中学习(SME、NTN、MLP、NAM等)
结合知识图谱特征学习的推荐系统:依次训练学习(DKN)、联合训练学习(CKE/Ripple Network)、交替训练学习(MKR)
【更新】为了具体介绍,博主更新了两篇新随笔:
CTR预估模型演变及学习笔记
基于图模型的智能推荐算法学习笔记(含知识图谱/图神经网络,不止于智能推荐)
【更新】介绍比较新的一些深度学习推荐模型改进方向:
引入用户行为序列建模(例如TDM/TransRec等)
将用户历史行为看做一个无序集合,对所有embedding取sum、max和各种attention等
将用户历史行为看做一个时间序列,采用RNN/LSTN/GRU等建模
抽取/聚类出用户的多峰兴趣,方法有Capsule等(阿里MIND提出)
根据业务场景的特殊需求,采用其他方法
引入NLP领域知识建模(例如Transformer/BERT等)
多目标优化/多任务学习(例如阿里ESMM/Google MMoE等)
多模态信息融合
长期/短期兴趣分离(例如SDM等)
结合深度强化学习(例如YouTube推荐/今日头条广告推荐DEAR等)
图神经网络的预训练(即引入迁移学习的思路)
......
三、混合推荐
1. 从推荐结果的角度
加权型混合推荐:指将多种推荐技术的计算结果加权混合产生推荐
分支型混合推荐:指根据问题背景和实际情况采用不同的推荐方法
混杂型混合推荐:指采用多种推荐技术给出的推荐结果,即取并集
2. 从特征的角度
特征组合:指组合来自不同推荐数据源的特征被另一种推荐算法所采用
特征扩充:指一种技术产生附加的特征信息嵌入到另一种推荐技术的特征输入中
3. 从算法的角度
增强型混合推荐:指前一个推荐方法的输出作为后一个推荐方法的输入
层叠型混合推荐:指第一推荐方法输出粗略的推荐列表,该推荐列表又由下一推荐方法改进
4. 从系统的角度
离线学习和在线学习:hadoop/storm/spark等大数据环境下的智能推荐
满足业务上的一些需求:加入人工规则等
四、智能推荐系统可能存在的问题
1. 冷启动问题
主要包含新用户启动问题、新物品启动问题和新系统启动问题
可以采用热门物品推荐、根据地域推荐、让用户选择兴趣标签、根据好友推荐、利用交叉领域信息等方法
2. 数据稀疏性问题
可以采用简单填值、用户/物品聚类、矩阵分解、降维、混合推荐等方法
3. 马太/长尾效应
指的是存在热门物品越来越受关注、其他物品越来越得不到关注的问题
可以采用混合推荐等方法
4. 模糊问题
指的是用户的兴趣爱好不太明显、比较散乱(例如一家人用同一个智能电视)
可以采用混合推荐等方法
5. 同义问题
指的是存在推荐相关性过大、甚至推荐重复的物品给用户(例如一个物品的不同版本)
可以采用混合推荐等方法
6. 稳定性/可塑性问题
指的是用户兴趣会慢慢改变、而推荐系统仍然保留用户的历史兴趣
可以对用户的兴趣物品进行时间衰减操作
7. 多样性/精确性问题
可以采用混合推荐等方法
五、智能推荐的企业级应用
1. 采用召回候选集+业务规则过滤+模型打分排序的智能推荐系统思路
(1)召回(matching):一般包括召回和粗排两个部分。粗排部分负责将各路召回的内容进行统一的排序,取出top的内容送入到排序模块中。粗排一般使用一些不那么复杂的模型,例如gbdt、lr、fm等。
(2)排序(ranking):一般包括精排和重排等部分。精排部分主要涉及到的技术为点击率预估(CTR预估),使用point-wise的方法对
两者的主要差别为:Deepmatch中没有目标物料的概念,而排序中可以使用目标物料,同时也可以基于目标物料做一些交叉特征。
* 建议可以好好学习一下Google 16年发表的 《Deep Neural Networks for YouTube Recommendations》框架,辅助理解。
2. 采用分支型混合推荐应对不同的业务场景
3. 评估指标
个人理解企业级的上线问题以及评估指标,应该与数据挖掘类似,这里不再赘述。
一是离线算法本身的评估指标:分类问题评估指标和回归问题评估指标等
二是业务上线的评估指标:例如点击率、转化率等
老规矩,最后直接上完整的思维导图!
如果您对数据挖掘感兴趣,欢迎浏览我的另一篇博客:数据挖掘比赛/项目全流程介绍
如果您对人工智能算法感兴趣,欢迎浏览我的另一篇博客:人工智能新手入门学习路线和学习资源合集(含AI综述/python/机器学习/深度学习/tensorflow)
如果你是计算机专业的应届毕业生,欢迎浏览我的另外一篇博客:如果你是一个计算机领域的应届生,你如何准备求职面试?
如果你是计算机专业的本科生,欢迎浏览我的另外一篇博客:如果你是一个计算机领域的本科生,你可以选择学习什么?
如果你是计算机专业的研究生,欢迎浏览我的另外一篇博客:如果你是一个计算机领域的研究生,你可以选择学习什么?
如果你对金融科技感兴趣,欢迎浏览我的另一篇博客:如果你想了解金融科技,不妨先了解金融科技有哪些可能?
之后博主将持续分享各大算法的学习思路和学习笔记:hello world: 我的博客写作思路
作者:FinTecher
出处:https://www.cnblogs.com/zhengzhicong/
如果觉得这篇文章对你有帮助的话,记得在右下角点个“推荐”,欢迎持续关注哦,博主在此感谢!
posted @
2020-05-06 01:13
FinTecher
阅读(17199)
评论(7)
编辑
收藏
举报
会员力量,点亮园子希望
刷新页面返回顶部
公告
Copyright © 2024 FinTecher
Powered by .NET 8.0 on Kubernetes
一文读懂无处不在的智能推荐系统 | 人人都是产品经理
一文读懂无处不在的智能推荐系统 | 人人都是产品经理
首页
培训课程
名师辅导课
产品经理入门实战班
90天B端产品实战班
AI重塑职场竞争力实战行动营
查看更多
个人自学课
互联网运营能力进阶
业务产品经理能力进阶
电商产品经理从入门到进阶
查看更多
企业内训课
数字化产品经理课
商业化产品实战课
数字化营销体系课
B端运营实战课
私域流量实战课
数据分析体系课
查看更多
分类浏览
业界动态
27977篇文章
产品设计
18064篇文章
产品运营
14472篇文章
产品经理
9484篇文章
职场攻略
4956篇文章
营销推广
4485篇文章
交互体验
3730篇文章
分析评测
3249篇文章
创业学院
2119篇文章
用户研究
1754篇文章
数据分析
1718篇文章
原型设计
1420篇文章
活动讲座
问答
企业培训
摸鱼
快讯
搜索
APP
起点课堂会员权益
职业体系课特权
线下行业大会特权
个人IP打造特权
30+门专项技能课
1300+专题课程
12场职场软技能直播
12场求职辅导直播
12场专业技能直播
会员专属社群
荣耀标识
{{ userInfo.member ? '查看权益' : '开通会员' }}
发布
注册 | 登录
登录人人都是产品经理即可获得以下权益
关注优质作者
收藏优质内容
查阅浏览足迹
免费发布作品
参与提问答疑
交流互动学习
立即登录
首次使用?
点我注册
一文读懂无处不在的智能推荐系统
felixxiao
2019-01-16
3 评论
18581 浏览
98 收藏
15 分钟
释放双眼,带上耳机,听听看~!
00:00
00:00
推荐系统是人与信息的连接器,用已有的连接去预测未来用户和物品之间会出现的连接。推荐系统本质上处理的是信息,它的主要作用是在信息生产方和信息消费方之间搭建起桥梁,从而获取人的注意力。
对于智能推荐系统相信大家已经不再陌生了,现在它已经在内容分发平台、电商、广告、音视频等互联网产品中随处可见。
一、为什么越来越多产品需要做推荐系统?
主要有以下两方面的原因:
(1)信息过载
互联网上每天都在产生海量的信息,用户想要迅速和准确地找到他们感兴趣的内容或商品越来越困难。如果用户的目标明确,他可以使用搜索(其实搜索也是有关键字的推荐、推荐是无关键字的搜索),但很多时候我们的用户是没有明确目标的。这时候如果产品能够高效匹配用户感兴趣的内容或商品,就能提高用户体验和粘性,获取更多的商业利益。
(2)长尾效应
绝大多数用户的需求往往是关注主流内容和商品,而忽略相对冷门的大量“长尾”信息, 导致很多优秀的内容或商品没有机会被用户发现和关注。如果大量长尾信息无法获取到流量,信息生产者就会离开平台,影响平台生态的健康发展。
二、认识推荐系统
推荐系统定义:推荐系统是人与信息的连接器,用已有的连接去预测未来用户和物品之间会出现的连接。
推荐系统本质上处理的是信息,它的主要作用是在信息生产方和信息消费方之间搭建起桥梁,从而获取人的注意力。
世界是一个数字化的大网,从人类角度来看里面只有两类节点:人和其他。万事万物有相互连接的大趋势,比如:人和人倾向于有更多社会连接,于是有了各种社交产品;比如:人和商品有越来越多的消费连接,于是有了各种电商产品;比如:人和资讯有越来越多的阅读连接,于是有了信息流产品。
一个完整的推荐系统通常由以下部分组成:用户端前台展示、后台日志系统、推荐算法引擎。
▲个人绘制的推荐系统架构图
前台展示:就是你在app或网页上看到的推荐、猜你喜欢、你的个性化歌单、经常一起购买的商品等部分展示的内容。
后台日志系统:用户数据、用户行为数据、内容数据等日志数据采集、存储、清洗和分析,从而建立画像体系,包括用户画像和物品画像。
推荐算法引擎:各种算法模型、模型训练配置、推荐效果评估体系。
搭建推荐系统所需投入:
首先要搭建团队,其中算法工程师是必不可少的,当前也是薪酬较高的;其次还要购置存储和计算资源,如果不是云产品你可能还要自己购置硬件设备;然后还有长时间的数据积累和算法优化。
推荐系统是一个需要长期持续投入的东西,从投入/产出比和时间成本上来说,产品经理不要随便拍大腿就要做一个智能推荐系统。
如何判断一个产品是否需要推荐系统?
第一,看看产品的目的。如果一款产品的目的是建立越多连接越好,那么它最终需要一个推荐系统。
典型的目的不是建立连接的产品就是工具类产品,单纯为提高人类某些工作的效率而存在,比如:AXURE、ERP……虽然如今很多产品都从工具切入想做成社区,但至少在工具属性很强时不需要推荐系统。
第二,看看产品现有的连接。如果你的产品中物品很少,少到用人工就可以应付过来,用户产生的连接不多,这时候不适合搭建推荐系统。应该要有长尾效应才可能让推荐系统发挥效果。
三、推荐算法-协同过滤基本原理
推荐系统里最经典的算法非协同过滤莫属。协同过滤又称基于领域的算法,核心在于协同,互帮互助。其又可以分为两类:基于用户的协同过滤算法(UserCF)、基于物品的协同过滤算法(ItemCF)。
(1)基于用户的协同过滤算法(UserCF)
当一个用户需要个性化推荐时,可以先通过用户的相似度计算找到和他有相似兴趣的其他用户,然后把那些用户喜欢而他没有听说过的物品推荐给他,这种方法称为基于用户的协同过滤算法。
如用户A曾经看过《增长黑客》、《流量池》和《原则》,用户B曾经看过《增长黑客》和《原则》,当我们给B推荐时,推荐系统计算出A和B的相似度比较高,而A曾经读过的《流量池》用户B没有读过,因此就将《流量池》推荐给B用户,这就是经典的基于用户的协同过滤。
由上面的描述可知,基于用户的协同过滤算法主要包括两个步骤:
找到和目标用户兴趣相似的用户集合;
找到这个集合中的用户喜欢的,且目标用户没有听说过的物品推荐给目标用户。
(2)基于物品的协同过滤算法(ItemCF)
介绍基于物品的协同过滤之前,先来看下基于用户的协同过滤可能带来的问题。
用户数据量比较大时,需要计算的用户之间的相似度会比较多,计算量大。
构建用户向量时是使用用户对已消费过的物品的评分/行为来构建的,用户的兴趣是会随时间改变的,导致计算相似用户的频率较高。
数据比较稀疏,用户和用户之间有共同的消费行为实际上是比较少的,而且一般都是一些热门物品,对发现用户兴趣帮助也不大。
基于物品的协同过滤算法,给用户推荐那些和他们之前喜欢的物品相似的物品。
用户A、B和C分别喜欢的物品如图所示,则计算物品2与物品1的相似度的公式为:
物品2与物品1的相似度=同时喜欢物品1和物品2的用户数/喜欢物品1的用户数=2/3;
物品3与物品1的相似度=0;
物品4与物品1的相似度=1;
如果对一个喜欢了物品1的用户D进行推荐,则推荐的优先级为4>2>3。
基于物品的协同过滤算法主要包括的步骤:
计算物品之间的相似度;
根据物品的相似度和用户的历史行为给用户生成推荐列表。
以上只是协同过滤算法的基本原理,现实中的算法模型要远比这个复杂,而且很少采用单一模型,基本是组合模型。我也是刚刚才开始做推荐系统,至于更为复杂的矩阵分解、基于机器学习的推荐算法等后续我自己搞明白再单独成文分享给大家。
四、推荐系统的冷启动
推荐系统需要已有的连接去预测未来用户和物品之间会出现的连接。
对于BAT(百度腾讯阿里)、TMD(头条美团滴滴)这样的巨头他们已经积累了大量的用户数据,在某个产品上智能推荐的时候不存在冷启动的问题。
对于很多没有大量用户数据的产品来说,如何在这种情况下设计推荐系统并且让用户对推荐结果满意,从而愿意使用推荐系统,就是冷启动的问题。
冷启动问题主要分两大类:
(1)用户冷启动
用户冷启动主要解决如何给新用户或者不活跃用户做个性化推荐的问题。当新用户到来时,我们没有他的行为数据,所以也无法根据他的历史行为预测其兴趣,从而无法借此给他做个性化推荐。
(2)物品冷启动
物品冷启动主要解决如何将新的物品或展示次数较少的物品推荐给可能对它感兴趣的用户这一问题。
一般来说,可以参考如下方式来解决冷启动的问题:
利用用户注册时提供的年龄、性别等数据做粗粒度的个性化推荐;
利用用户的社交网络账号登录(需要用户授权),导入用户在社交网站上的好友信息,然后给用户推荐其好友喜欢的物品;
要求新注册用户在首次登录时选择一些兴趣标签,根据收集到的用户兴趣信息,给用户推荐同类的物品;
给新用户或不活跃用户推荐热门排行榜,然后等到用户数据收集到一定的时候,再切换为个性化推荐。
五、评估推荐系统的效果
推荐系统推荐质量的高低可以通过如下指标进行评估,作为推荐系统的反馈结果他们也是算法模型迭代优化的依据。这些指标有些可以定量计算,有些只能定性描述。
(1)预测准确度
准确度表现在用户对推荐内容的点击率,点击后的各种主动行为(购买、分享等),停留时长等。
(2)覆盖率
覆盖率是描述一个推荐系统对物品长尾的发掘能力。最简单的定义是,推荐系统推荐出来的物品占总物品的比例。
(3)多样性
良好的推荐系统不仅仅能够准确预测用户的喜好,而且能够扩展用户的视野,帮助用户发现那些他们可能会感兴趣,但不那么容易发现的东西。
比如:你在某个电商网站买了一双鞋子,然后你每次登录这个网站他都给你推荐鞋子,这种情况你就会对推荐系统很失望,这就是典型的不具备多样性。假如知道了用户的喜好,推荐系统大部分给他推荐感兴趣的,小部分去试探新的兴趣是更优的策略。
(4)新颖性
新颖的推荐是指给用户推荐那些他们以前没有听说过的物品。
(5)惊喜度
如果推荐结果和用户的历史兴趣不相似,但却让用户觉得满意,那么就可以说推荐结果的惊喜度很高。与新颖性的区别是推荐的新颖性仅仅取决于用户是否听说过这个推荐结果。
(6)信任度
如果你有两个朋友,一个人你很信任,一个人经常满嘴跑火车,那么如果你信任的朋友推荐你去某个地方旅游,你很有可能听从他的推荐,但如果是那位满嘴跑火车的朋友推荐你去同样的地方旅游,你很有可能不去。这两个人可以看做两个推荐系统,尽管他们的推荐结果相同,但用户却可能产生不同的反应,这就是因为用户对他们有不同的信任度。
(7)实时性
推荐系统的实时性,包括两方面:一是实时更新推荐列表满足用户新的行为变化;二是将新加入系统的物品推荐给用户。
(8)健壮性
任何能带来利益的算法系统都会被攻击,最典型的案例就是搜索引擎的作弊与反作弊斗争。健壮性衡量了推荐系统抗击作弊的能力。
参考资料:
项亮.《智能推荐实践》;
邢无刀.《推荐系统三十六计》。
作者: felixxiao,微信公众号:PMfelix
本文由 @felixxiao 原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自Unsplash,基于CC0协议
收藏已收藏{{ postmeta.bookmark }}
点赞已赞{{ postmeta.postlike }}
更多精彩内容,请关注人人都是产品经理微信公众号或下载App
2年初级智能推荐系统
felixxiao
微信公众号:PMfelix,胸怀千万里,心思细如丝,用心做产品!
2篇作品
34014总阅读量
为你推荐
趣头条,困死在了网赚里
03-221961 浏览
离开产品岗一年后重新回归,如何快速找到产品工作?
04-265383 浏览
打造一个基于本地社区的闲置交易平台,你看好吗?
05-223745 浏览
用户体验五要素在产品经理竞品分析中的有针对性应用
07-219765 浏览
B端产品|RBAC模型的实践和思考
11-071253 浏览
评论
评论请登录
产品狗007
深入浅出,很有帮助
最近
来自四川 回复
孙光海
写的真不错!
最近
来自广东 回复
BenChur
总结的很好,期待新的文章!
最近
来自美国 回复
为你推荐
我去围观了一下决意要把自己托付给web3的香港
04-213935 浏览
2023年,电商平台争夺战从C端转向B端?
03-164015 浏览
HMI | 结合地图竞品分析,拆解车载地图交互
12-141433 浏览
快讯
查看更多
热门文章
我去了县里吃顿饭,终于知道抖音美团为什么不灵了
03-06
如何用AI重做B端产品2:从微软与天猫案例中学习
03-06
小红书推出「地图」新功能,终于要对「本地生活」下手了?
03-05
知识还存在吗?AI 时代社会从知识经济转变为分配经济
03-07
B端产品经理的「AI产品错题本」
03-05
百度输入法付费,冒犯了谁?
03-01
文章导航
一、为什么越来越多产品需要做推荐系统?
二、认识推荐系统
三、推荐算法-协同过滤基本原理
四、推荐系统的冷启动
五、评估推荐系统的效果
关于
人人都是产品经理(woshipm.com)是以产品经理、运营为核心的学习、交流、分享平台,集媒体、培训、社群为一体,全方位服务产品人和运营人,成立12年举办在线讲座1000+期,线下分享会500+场,产品经理大会、运营大会50+场,覆盖北上广深杭成都等20个城市,在行业有较高的影响力和知名度。平台聚集了众多BAT美团京东滴滴360小米网易等知名互联网公司产品总监和运营总监,他们在这里与你一起成长。
合作伙伴
链接
隐私政策
投稿须知
意见反馈
帮助中心
公众号
视频号
友情链接
PM265
产品经理导航
起点课堂
猪八戒网
人才热线
伙伴云表格
网易易盾
个推
友盟+
粮仓
创业邦
每日报告
鸟哥笔记
慕课网
旗下品牌: 起点课堂 | 运营派 | 粮仓企微管家
©2010-2024 - 人人都是产品经理 - 粤ICP备14037330号-粤公网安备 44030502001309号
广播电视节目制作经营许可证(粤)字第03109号 版权所有 © 深圳聚力创想信息科技有限公司
“推荐算法”究竟是什么?这篇科普报告帮你快速了解
“推荐算法”究竟是什么?这篇科普报告帮你快速了解
首页
学院概况
学院简介
学院寄语
领导机构
新闻公告
学院新闻
学院公告
新闻人物
精彩视频
学术讲座
师资队伍
师资队伍
人才招聘
学生培养
人才培养导师组
本科生
学术型硕士
博士生
教育公告
高礼研究院
En
教师入口
检索
新闻公告
学院新闻
学院公告
新闻人物
精彩视频
学术讲座
您所在的位置:
首页-
新闻公告-
学院新闻-
学院新闻
“推荐算法”究竟是什么?这篇科普报告帮你快速了解
日期:2022-01-07访问量:
算法究竟是什么?我们为什么需要算法?
算法是否能服务人在获取信息时对效率提升、公平发展的诉求?
今年,在中国人民大学高瓴人工智能学院举办的“推荐算法社会价值与可持续发展”研讨会上,我们发布了《算法向善与个性化推荐发展研究报告》(下称《报告》)。
在这份算法科普性报告中,课题组围绕这些热点问题进行了探讨。
1、算法是什么?我们为何需要算法?
互联网数据中心发布的《数据时代2025》报告显示,全球每年产生的数据将从2018年的33ZB(十万亿亿字节)增长到175ZB,相当于每天产生491EB(百亿亿字节)的数据。
在本质上,算法是“以数学方式或者计算机代码表达的意见”。其中,推荐系统就是一个信息过滤系统,帮助用户减少因浏览大量无效数据而造成的时间、精力浪费。
图1 :用数学公式解决“鸡兔同笼”问题体现了算法思维
图2:推荐算法帮助“宝妈”节省信息搜索时间
2、推荐技术发展历史上的关键事件有哪些?
“信息过载(Information Overload)”是在上个世纪80、90年代就已经存在的概念。随着信息技术和互联网的快速发展,人类从信息匮乏时代走向了信息过载时代。
《报告》研究指出,早期的研究提出了通过信息检索和过滤的方式来解决这个问题。
到了上世纪90年代中期,研究者开始通过预测用户对推荐的物品、内容或服务的评分,试图解决信息过载问题。推荐系统由此也作为独立研究领域出现了。
图3:推荐系统发展历史
3、推荐系统有哪几个类型?
在《报告》看来,推荐系统发展至今,其核心技术可大致分为“基于协同过滤的推荐方法”、“基于内容的推荐方法”,以及“混合推荐方法”。
基于协同过滤的推荐方法,本质是根据相似的用户具有相似的喜好,推荐给他们喜欢的物品、内容或者服务。
图4:基于协同过滤的推荐方法
基于内容的推荐方法:根据项的相关信息(描述信息、标签等)、用户相关信息及用户对项的操作行为(评论、收藏、点赞、观看、浏览、点击等),来构建推荐算法模型。
图5:基于内容的推荐方法
混合推荐方法:衡量各推荐方法的利弊,扬长避短,通过加权、切换、混杂、特征组合等方式避免或弥补各推荐技术弱点,进一步提升推荐方法性能。
图6:融合知识图谱的混合推荐方法
4、什么是个性化推荐算法?
纵观推荐系统的发展历史,可将其大致分为非个性化推荐系统和个性化推荐系统。
其中,个性化推荐系统,就是为每一个特定用户提供特定的服务,实现“千人千面”,服务个性化诉求。
图7:在个性化推荐算法下,不同人搜索“京剧”一词结果不同
5、推荐算法,会导致信息窄化吗?
在外界的印象里,个性化推荐就像漏斗一样,会将推荐内容与用户相匹配,倾向于向用户推荐高度符合其偏好的内容,致使推荐的内容越来越窄化。
但与外界的固有认知相反,《报告》认为在行业实践中,互联网应用(特别是位于头部的大型平台)有追求算法多样性的内在动力。
在对行业内代表性应用的数据分析后,《报告》发现,阅读内容的类型数量是否够多、所阅读内容类型的分散程度是否够高,与用户是否能长期留存关联密切,呈正相关。上述两项指标对用户长期留存的作用,可以与信息的展现总量、用户的停留时长、用户阅读量等指标的影响相媲美。
推荐技术并不是单纯地“投其所好”。在一些专家看来,在推荐已知的用户感兴趣内容基础上,如果能深入激发、满足用户的潜在需求,那么算法就能更好地满足人对信息的多维度诉求。
图8:贵州返乡创业青年丁浪用抖音号@黔东农仓 记录腌蒜苔制作过程。在推荐系统的帮助下:1)视频能被准确推荐给对乡村美食、农特产品感兴趣的用户;2)用户能顺势在同屏搜索框中搜索、了解蒜苔烹饪相关内容,扩展相关知识。
6、算法如何服务人对安全的诉求?
在人工智能技术快速发展的今天,内容安全一直是公众关注的重点。
《报告》观察发现,当前很多内容创作与分发平台,从创立之初就将用户和内容安全视为最高优先级问题。
以今日头条为例,在内容安全技术方面采用了鉴黄模型、谩骂模型以及低俗模型等内容识别技术。抖音安全中心则自主研发反欺诈模型、风控策略,结合抖音产品功能、内容属性、用户行为特征,对欺诈行为进行主动拦截。
图9:抖音安全中心通过算法技术主动拦截欺诈行为
7、推荐技术如何服务人对公平的诉求?
《报告》认为,推荐系统中的“公平”是站在不同角度定义问题。
比如在招聘网站上,求职者方可能将公平定义为“相同的学历和能力可以被推荐类似的工作,而不受国籍、种族和性别等偏见”;对于招聘方,“公平”可能为“系统可以将他们的招聘信息推给优质的求职者,而不会因为公司的背景等因素,只将招聘信息推给不太合适的求职者”。
从关注的角度出发,《报告》认为公平性可分为“用户角度”、“物品角度”这两种公平性。
用户偏好放大是针对用户方(user)的公平性问题,体现为用户搜索了一样东西后,接下来一段时间的推荐都与该物品相关。流行度偏差,则通常是针对物品方(items)的公平性问题,体现为推荐系统更多推荐较为流行的物品,而不流行的物品有较少的机会被推荐或展示,造成推荐系统中的“马太效应”。
当前,学界对算法公平性的研究与探讨正不断深入。
麻省理工学院(MIT)在2021年发布的十大突破技术(10 Breakthrough Technologies)中指出,TikTok推荐算法能够使普通人发的内容有机会受到名人般的关注并流行起来,这是内容公平性的体现;而需求较为小众、细分的用户,也能看到符合自己兴趣的内容,则是用户角度公平性的体现。
图10: 在抖音等国内短视频直播平台上,也能看到更多推荐系统服务“用户”、“物品”公平的案例
附件:算法向善与个性化推荐发展研究报告
友情链接
中国人民大学信息学院
中国科学技术协会
中国外文出版发行事业局
联系
ai@ruc.edu.cn | 86-10-62511257
北京市海淀区中关村大街59号中国人民大学
copyright 2021 中国人民大学高瓴人工智能学院
关注我们
检测到您当前使用浏览器版本过于老旧,会导致无法正常浏览网站;请您使用电脑里的其他浏览器如:360、QQ、搜狗浏览器的速模式浏览,或者使用谷歌、火狐等浏览器。
下载Firefox
友情链接
中国人民大学信息学院
中国科学技术协会
中国外文出版发行事业局
联系
ai@ruc.edu.cn
86-10-62511257
智能推荐_个性化推荐_内容推荐_大数据-阿里云
智能推荐_个性化推荐_内容推荐_大数据-阿里云
智能推荐_个性化推荐_内容推荐_大数据-阿里云
产品解决方案文档与社区权益中心定价云市场合作伙伴支持与服务了解阿里云售前咨询 95187-1 在线服务售后咨询 4008013260 在线服务其他服务 我要建议 我要投诉更多联系方式备案控制台
智能推荐 AIRec播放视频智能推荐(Artificial Intelligence Recommendation,简称AIRec)基于阿里巴巴大数据和人工智能技术,以及在电商、内容、直播、社交等领域的业务沉淀,为企业开发者提供场景化推荐服务、全链路推荐系统开发平台、工程引擎组件库等多种形式服务,助力在线业务增长。场景化推荐服务首购首月仅需100元立即购买产品控制台帮助文档产品价格企业咨询
产品优势产品功能试用流程应用场景产品动态视频专区文档与工具
最新活动重磅发布全链路推荐系统开发平台PAIREC公测实战介绍一站式个性化信息流应用与开发实战介绍系列课程参与免费公开课,玩转智能推荐最佳实战AIRec个性化推荐召回模型调参实战(电商、内容社区为例)最佳实践流量扶持通过流量调控功能实现物品扶持推荐过滤通过推荐过滤功能实现Feed流个性化过滤体验提升调整I2I算法策略,强化实时反馈的用户体验行业应用调整新品策略,高效扶持新品流量
产品优势
多套服务,灵活接入适合多种推荐业务开放阶段模型丰富,开箱即用提供基于EasyRec的数十种推荐算法行业定制,效果优质行业内置算法模板,效果涨幅可观架构先进,性能稳定历经多次双十一演练,服务稳定性强
产品功能
模式1:场景化行业智能推荐服务智能推荐AIRec服务,为企业提供基于电商、内容、新闻行业算法模板,仅需完成基础的数据对接,即可开启个性化推荐功能。且支持通过配置化页面优化算法、运营规则,提升推荐业务效果。核心能力选品与投放策略定制操作台 ; 行业算法模板,参数灵活配置; 场景级别ABTest,开放在线实验;立即查看适用企业开发人员精简,短期上线功能; 业务逻辑丰富,多场景管理; 适用于电商、内容、新闻等行业;立即查看前置准备工作完成行为数据埋点采集; 清洗规范化用户、物品数据; 明确推荐页面业务逻辑;立即查看接入流程根据行业数据规范清洗3种数据; 初始化行业模板,调试推荐接口; 场景运营策略、算法参数调优;立即查看模式2:全链路推荐系统开发平台满足企业根据推荐系统算法模型、工程架构的设计原理,实现各个链路与板块的明确拆分。可根据业务特点及效果诉求,灵活开发推荐场景,并结合推荐方案实施多组在线实验,加速迭代效率。核心能力部分源码开放,开发更灵活; 推荐模型开箱即用,训练推理一致性保证;立即查看适用企业需要且长期投入优化推荐服务; 有一定的推荐算法、工程自建基础;立即查看前置准备工作完成行为数据埋点采集; 完成相关云产品开通、授权; 明确技术方案选型;立即查看接入流程联系专业人员进行方案沟通; 按需开通云产品、进行服务授权; 算法效果共建与优化;立即查看模式3:高性能工程引擎组件基于阿里巴巴中台搜索、推荐业务沉淀,推出重磅引擎组件上云。开发者可根据搜索、推荐技术架构,灵活接入业务系统,提升性能与稳定性实时特征存储引擎ABFS多元特征简易拼接查询,毫秒级返还查询结果;立即查看在线召回引擎BE毫秒级召回万级推荐候选集 ,多路召回、过滤逻辑灵活定制;立即查看个性化开发平台TPP在线代码实验灵活开展,弹性扩缩容,自动升降级;立即查看
试用流程
提交咨询表单简单描述项目背景、优化需求等基础信息。合作咨询专家一对一交流专家将与您深度交流,并进行选型指导。接入测试专家将协助您跑通数据准备、模型部署、服务上线全流程。效果持续迭代基于应用效果持续优化算法,助力业务增长。
典型应用场景
零售/电商网站视频平台社交平台在线书城新闻客户端电商:提升转化率,促进商城GMV增长打造首页猜你喜欢、种草社区、购物车、详情页等转化页面。 提升用户浏览体验、消费体验,促进购买决策与商城收入。核心效果指标点击率(pv_ctr,uv_ctr)转化率(pv_cvr,uv_cvr)销售收入(GMV)相关云产品AIRecMaxCompute视频:提升访问粘性,促进停留增长带动广告收入打造沉浸流Feed、频道专区、兴趣卡片等。提升用户浏览体验、访问粘性,激发创作,带动收入提升。核心效果指标播放时长人均播放视频个数客户案例南瓜电影相关产品PAI-DesignerPAI-EASBEABFS社交:挖掘数据价值,提升互动体验打造交友、社区、聊天室等多元推荐场景。 优化互动体验,提升平台服务质量。核心效果指标互动率聊天时长相关产品PAI-EASPAI-Designer阅读:打造独家书单,提升阅读时长打造个性化榜单、频道、相关推荐场景。 提升新老用户停留、付费转化等多维指标。核心效果指标人均阅读章节数人均阅读时长新用户次日、7日留存相关产品AIRec新闻:打造个性化专区,提升用户访问时长打造多种题材频道个性化专区,相关阅读推荐。提升发现性、多样性体验,促进阅读时长增长。核心效果指标点击率人均阅读时长相关产品AIRecMaxComputePAI-EAS
产品动态
查看详情2019-10-31 新功能大数据应用服务—智能推荐AIRec电商行业转化率模型发布查看详情2020-01-01 体验优化智能推荐用户、物品数据实时查询发布查看详情2020-02-14 新功能智能推荐-定制版客户端SDK发布查看详情2020-06-12 新功能智能推荐支持负反馈功能查看详情2020-09-01 新功能服务与计费优化查看详情2020-10-26 新功能产品新功能发布(推荐历史查询、实例物品池管理、监控告警升级)查看详情2021-01-14 新功能智能推荐一实例支持开通猜你喜欢、相关推荐2种服务类型查看详情2021-06-25 新功能智能推荐AIRec标准版开放召回模型调参与实验平台功能查看详情2021-09-17 新功能智能推荐支持Feed过滤定制、免曝光免traceinfo对接服务、物品分发维度指标分析等功能查看详情2022-02-18 新功能智能推荐支持自助开发MultiTower、DeepFM排序模型服务查看详情2022-06-25 新功能合规推荐、快速体验与数据智能诊断功能查看详情2022-07-15 新版本/新规格运营版开放售卖-支持完整的推荐算法链路并搭配易用的运营工具查看详情2022-08-29 新功能新手Step by Step引导控制台查看详情2022-08-29 新功能推荐原因解释分析查看详情2022-10-28 新功能流量调控查看详情了解全部动态
视频专区
新手推荐系统介绍推荐业务场景实战及用户心智立即查看新手0-1搭建电商网站智能推荐在电商行业的业务价值、实践案例和快速上手指南立即查看进阶模型开发与在线实验推荐场景下行业典型业务增长指标及服务对接方案立即查看
文档与工具
快速入门立即上手开发指南数据规范服务端SDK参考请求结果最佳实践应用参考
什么是智能推荐_智能推荐算法_人工智能推荐-亚马逊云科技
什么是智能推荐_智能推荐算法_人工智能推荐-亚马逊云科技
跳至主要内容
Click here to return to the Amazon Web Services China homepage
全球网站
联系我们
文档
ICP备案
中文(简体)
我的账户
免费注册
关于我们
产品
解决方案
定价
客户支持
合作伙伴网络
Marketplace
开发者
初创公司
活动与促销
关闭
English
中文 (简体)
关闭
管理控制台
账户设置
账单与成本管理
安全证书
Click here to return to Amazon Web Services homepage
免费注册
联系我们
关于我们
产品
解决方案
定价
文档
客户支持
合作伙伴
Marketplace
开发者
初创公司
活动与促销
注册/登录
10 分钟上手教程,手把手带您入门产品操作,立即学习 »
10 分钟上手教程,手把手带您入门产品操作,立即学习 »
首页 » 云计算知识 » 什么是智能推荐
什么是智能推荐?
智能推荐,是一项充分融合大数据与人工智能优势的技术服务,以数据分析高效洞察消费者行为偏好,加持企业与终端用户彼此间的深度互联;该服务结合亚马逊云科技与电商、传媒、游戏等行业合作伙伴的生态优势,可为用户提供智能化、个性化的高效服务。
新用户享受中国区域 12 个月免费套餐
立即注册
联系云计算专家
首页 » 云计算知识 » 什么是智能推荐
什么是智能推荐?
智能推荐,是一项充分融合大数据与人工智能优势的技术服务,以数据分析高效洞察消费者行为偏好,加持企业与终端用户彼此间的深度互联;该服务结合亚马逊云科技与电商、传媒、游戏等行业合作伙伴的生态优势,可为用户提供智能化、个性化的高效服务。
新用户享受中国区域 12个月免费套餐
立即注册
联系云计算专家
智能推荐算法
智能推荐算法
智能推荐算法,是为了达成个性化推荐目的设置的一系列清晰指令,主要包括协同过滤、矩阵分解、聚类、深度学习。
协同:过滤协同过滤是打造个性化推荐时的常用算法,可针对有相似兴趣的群体进行智能推荐。
矩阵分解是通过三角分解、QR 分解等方式拆解矩阵的优雅算法。使用该算法时,无须过多思考项目所处矩阵的具体列和行。
聚类:聚类算法是将未知对象进行归类的算法,在构建智能推荐系统时,若缺失此前用户数据,可选用聚类算法。
深度学习是利用神经网络技术的复杂机器学习算法,能够让机器更真切地模仿人体视听活动。
人工智能推荐
人工智能推荐
人工智能推荐,是一项基于 AI 技术构建的推荐系统服务。多元化时代,凭借人工智能推荐可以对海量大数据进行自动化集成,并通过数据分析、数据过滤,持续洞察终端用户,赋能企业进阶为数据驱动决策型组织。打造人工智能推荐系统,能够显著缩短产品搜索时长、提升搜索相关性、加持用户忠诚度、提升平均订单价值以及整体转化率。如今,零售、支付、金融等行业均在广泛应用人工智能推荐,布局全渠道营销战略,深化终端消费者洞察,加速数据变现。
人工智能推荐应用
人工智能推荐应用
人工智能推荐作为被业界广泛推崇、应用的个性化服务机制,能够为互联网用户或消费者梳理、剔除垃圾信息和无意义数据,依据用户个性化需求,输出强相关信息,大幅降低用户检索有效信息的时间成本,可有力应用于预判偏好、强力推荐、关联购买、加持复购等场景。
预判偏好
购买场景中的“猜你喜欢”,即人工智能推荐的预判偏好应用。这项功能可基于用户过往整体消费习惯与兴趣模式,有效提升商家侧的商品曝光率,打造更“懂”用户的智能推荐营销体系。
强力推荐
强力推荐,是人工智能结合销量推荐列表和用户浏览类别、消费历史等大数据行为特征,推荐符合用户兴趣的产品。凭借销售热度的佐证,以及用户个性化购买行为,强力推荐可有效激发用户购买欲望,保障下单率稳步增长。
关联推荐
关联推荐是一项常用的人工智能推荐应用,其原理是分析用户采购产品组合(如购物车列表)高频出现的商品。通过对海量大数据的深入挖掘,关联推荐可帮助商家自动化扩大推荐商品组合,加持营收、提升用户黏性。
加持复购
以 AI/ML 技术能够深入挖掘用户历史行为及偏好数据,探寻用户一定时期内购买产品的重复性特征,以此关联相关产品,助力用户快速触达心仪商品,提升复购率、平均订单收益。
预判偏好
购买场景中的“猜你喜欢”,即人工智能推荐的预判偏好应用。这项功能可基于用户过往整体消费习惯与兴趣模式,有效提升商家侧的商品曝光率,打造更“懂”用户的智能推荐营销体系。
强力推荐
强力推荐,是人工智能结合销量推荐列表和用户浏览类别、消费历史等大数据行为特征,推荐符合用户兴趣的产品。凭借销售热度的佐证,以及用户个性化购买行为,强力推荐可有效激发用户购买欲望,保障下单率稳步增长。
关联推荐
关联推荐是一项常用的人工智能推荐应用,其原理是分析用户采购产品组合(如购物车列表)高频出现的商品。通过对海量大数据的深入挖掘,关联推荐可帮助商家自动化扩大推荐商品组合,加持营收、提升用户黏性。
加持复购
以 AI/ML 技术能够深入挖掘用户历史行为及偏好数据,探寻用户一定时期内购买产品的重复性特征,以此关联相关产品,助力用户快速触达心仪商品,提升复购率、平均订单收益。
亚马逊云科技产品为客户提供卓越的智能推荐服务
亚马逊云科技产品为客户提供卓越的智能推荐服务
Amazon Personalize 能够快速实现大规模的个性化客户体验。该服务使用各种个性化实例轻松开发应用程序,涉及特定产品推荐、个性化搜索结果和定制化直销。作为一项完全托管的服务,Amazon Personalize 可训练、调整和部署自定义的私有机器学习模型。客户通过应用程序编程接口 (API) 获得结果,只需按使用量付费,无需预先消费承诺。
高质量的实时推荐
加持 ML 算法支持的 Amazon Personalize 具有更高质量的推荐服务,能够响应用户的不同维度的特定需求、偏好和动态行为模式,进而提升用户黏性和转化收益。此外,该服务还能够解决更为复杂的问题,如为缺失历史数据的新用户、产品和内容进行实时推荐。
数天内轻松部署个性化推荐
依托 Amazon Personalize 的自动化能力,您无需消耗数月时间,仅需数天时间即可部署由 ML 支持的自定义个性化推荐系统,而无需构建、训练和部署人工操作的机器学习解决方案。
关注全生命周期个性化触点
全渠道营销过程中,Amazon Personalize 可轻松集成网站、应用程序、短信和电子邮件营销数据,并为全渠道和终端打造定制化服务体验,从而实现降本提效。同时,Amazon Personalize 具有助力企业依据自身情况,提升实时、批量定制个性化方案的灵活性。
全方位守护数据隐私安全
为确保私密性与安全性,Amazon Personalize 中的所有数据都会被加密,同时数据仅用于为客户创建推荐,而不会在客户间或与亚马逊云科技共享。此外,您还可以使用自己的 Key Management Service (KMS) 密钥严控对加密数据的访问。
高质量的实时推荐
加持 ML 算法支持的 Amazon Personalize 具有更高质量的推荐服务,能够响应用户的不同维度的特定需求、偏好和动态行为模式,进而提升用户黏性和转化收益。此外,该服务还能够解决更为复杂的问题,如为缺失历史数据的新用户、产品和内容进行实时推荐。
数天内轻松部署个性化推荐
依托 Amazon Personalize 的自动化能力,您无需消耗数月时间,仅需数天时间即可部署由 ML 支持的自定义个性化推荐系统,而无需构建、训练和部署人工操作的机器学习解决方案。
关注全生命周期个性化触点
全渠道营销过程中,Amazon Personalize 可轻松集成网站、应用程序、短信和电子邮件营销数据,并为全渠道和终端打造定制化服务体验,从而实现降本提效。同时,Amazon Personalize 具有助力企业依据自身情况,提升实时、批量定制个性化方案的灵活性。
全方位守护数据隐私安全
为确保私密性与安全性,Amazon Personalize 中的所有数据都会被加密,同时数据仅用于为客户创建推荐,而不会在客户间或与亚马逊云科技共享。此外,您还可以使用自己的 Key Management Service (KMS) 密钥严控对加密数据的访问。
亚马逊云科技热门云产品
亚马逊云科技热门云产品
Amazon SageMaker
面向开发人员和数据科学家的机器学习
了解 Amazon SageMaker
Amazon Deep Learning AMI
快速构建深度学习应用程序
了解 Amazon Deep Learning AMI
Amazon KMS
轻松创建和控制用于加密数据的密钥
了解 Amazon KMS
Amazon CodeCommit
安全托管私有 Git 存储库,加持代码协作
了解 Amazon CodeCommit
欢迎加入亚马逊云科技培训中心
从 0 到 1 轻松上手云服务,获取更多官方开发资源及培训教程
了解详情
准备好体验亚马逊云科技提供的云服务了吗?
新用户享受中国区域 12 个月免费套餐
立即注册
联系我们
在线咨询架构师
亚马逊云科技产品入门
产品的用户指南、培训和教程,立即查看 »
亚马逊云科技客户成功案例
亚马逊云科技帮助客户提高交付灵活性、可扩展性和可靠性,立即查看 »
云计算知识合集
一站直达最新对云计算资讯详解,助您尽快掌握和使用云计算服务,立即查看 »
开始使用亚马逊云科技免费构建
开始使用亚马逊云科技免费构建
中国区域免费套餐
全球区域免费套餐
关闭
在线咨询
专家实时解答您的售前、售后问题
热线
1010 0766
由光环新网运营的
北京区域
1010 0966
由西云数据运营的
宁夏区域
联系顾问
让解决方案顾问与您联系
关闭
热线
1010 0766
由光环新网运营的
北京区域
1010 0966
由西云数据运营的
宁夏区域
在线咨询
专家实时解答您的售前、售后问题
联系顾问
让解决方案顾问与您联系
亚马逊云科技官方微博
|
亚马逊云科技中国博客
|
在线咨询云计算专家
由西云数据运营的亚马逊云科技中国(宁夏)区域咨询热线:1010 0966
|
由光环新网运营的亚马逊云科技中国(北京)区域咨询热线:1010 0766
免费注册
关于我们
亚马逊云科技简介
亚马逊云科技中国
产品动态
新闻中心
分析师报告
亚马逊云科技中文博客
客户成功
什么是云计算?
什么是大数据?
什么是云存储?
什么是人工智能?
什么是数据湖?
产品与解决方案
所有产品
计算
存储
数据库
网络和内容分发
管理工具
安全性、身份与合规性
分析
应用程序服务
消息收发
物联网
解决方案
资源与支持
开发人员工具
价格计算器
支持计划
客户支持 FAQ
服务运行状况仪表板
文档
云计算文章
ICP 备案服务
等保合规
管理账户
管理控制台
账单与成本管理
个人信息
支付方法
安全证书
请求提升服务限额
联系我们
亚马逊云科技中国简介
我们致力于为中国的软件开发人员和企业提供安全、灵活、可靠且低成本的 IT 基础设施资源,帮助他们实现创新和快速扩大企业规模。
"AWS" 是"Amazon Web Services"的缩写,在此网站不作为商标展示。
详细了解怎样在中国使用 亚马逊云科技服务 »
Language
English
中文 (简体)
网站条款
|
隐私
|
法律条款
|
合规提示
|
网站地图
|
友情链接
宁公网安备 64050202000147号
|
宁ICP备17000743号-11
终止对 Internet Explorer 的支持
知道了
我们对 Internet Explorer 的支持将于 07/31/2022 结束。受支持的浏览器包括 Chrome、Firefox、Edge 和 Safari。
知道了
神策智能推荐|赋能业务增长的智能推荐系统 - 神策数据产品
神策智能推荐|赋能业务增长的智能推荐系统 - 神策数据产品
神策智能推荐
赋能业务增长的智能推荐系统
神策智能推荐专注于赋能业务增长。以用户行为数据为基础,采用深度学习等先进的机器学习 算法,帮助企业构建智能物品分发中心,实现对用户“千人千面”的个性化推荐,改善用户体验, 持续提升核心业务指标。
预约演示
观看视频
✖️
推荐不止是算法,推荐的关键是数据
数据是一切算法的根基,是一切迭代的依据!
推荐不止是算法,推荐的关键是数据
数据是一切算法的根基!
数据是一切迭代的依据!
“数据+智能+反馈”的全流程推荐系统
神策推荐系统是一套全流程闭环推荐方案。支持采集终端(Web、App、H5、小程序、软件等)的用户行为、后端服务器日志(Log)、业务数据和第三方等多方数据源,存储细粒度数据,利用深度学习和语义分析模型构建推荐引擎,推荐结果可利用数据分析模型多维度、多指标的实时效果分析,形成快速反馈,精准迭代特征集和算法模型。
推荐技术架构
客户案例
惠头条个性化推荐案例
惠头条是为用户推荐有价值、个性化的内容资讯。每天送金币奖励,让用户找到符合兴趣的内容,观看内容领取金币奖励。
核心目标为了提升点击率;推荐场景是Feed流和相关推荐;神策智能推荐上线后,CTR比原有自建推荐系统提升了 40.67%。
纵横文学个性化推荐案例
纵横文学,是以百度文学为前身,由百度与完美世界联合投资打造的文学平台,旗下拥有“纵横中文网”, “熊猫看书”等知名产品。
在熊猫看书首页,推荐用户喜欢的小说,兼顾内容多样性;小说详情页、阅读页、播放页的底部或两侧,推荐跟小说内容相关的小说,提升用户粘性;神策智能推荐上线后,推荐点击率和付费转化率都有明显提升。
神策优势
算法功能强大
提供深度学习等先进的机器学习算法,保证优秀的推荐效果。
私有化部署
支持私有化部署,积累用户行为数据资产,确保核心数据资产安全,用更低的硬件成本满足性能需求。
推荐运营干预
可视化平台支持自主对物品设置加权、封禁、必推、过滤等运营干预能力,推荐结果更符合业务实际需求。
采集 & 推荐更实时
全端数据实时采集,算法模型实时计算,推荐结果实时展现,满足高时效的用户体验。
团队赋能 & 白盒
提供整体方案培训,赋能客户算法团队,让算法逻辑可见,结果可用。
算法可精准迭代
基于效果分析,可灵活调整特征集, 迭代模型参数,快速调优整体方案, 不断满足业务变化,追求更高收益。
数据驱动,从现在开始!
立即咨询,和神策咨询顾问一起开启数据驱动之旅!
预约演示
智能推荐_个性化推荐_内容推荐
智能推荐_个性化推荐_内容推荐
腾讯云最新活动HOT产品解决方案定价企业中心云市场开发者客户支持合作与生态了解腾讯云关闭
搜索
营销智能推荐 REM营销智能推荐(Intelligent Recommendation)利用大数据和人工智能技术,实现人与物品的精准匹配,通过信息流推荐的用户交互形式,对用户提供个性化的内容/商品推荐,提升客户业绩指标。申请体验产品文档产品特性及优势领先的算法和技术积累结合最新的腾讯算法能力进行模型训练,训练完成后可供商家直接使用。灵活的推荐策略配置支持商家配置不同的推荐策略,同时针对不同的运营需求、商家可随时设置人工干预规则,如置顶、必推、过滤等。支持AB实验商家可自主分配流量进行AB实验,发布上线后系统将自动采集效果数据,帮助商家测试以选择最优的策略。应用场景个性化商品推荐个性化内容推荐通过对用户和商品的特征理解,以及结合用户的商品浏览、加购等行为,实现千人千面的个性化商品推荐,如猜你喜欢、购物车推荐等场景,帮助商家提升商品转化率。产品矩阵企点营销与分析6.0 产品套件: 基于腾讯社交生态连接公私域的, 一体化、 场景化、 智能化分析云与营销云, 助力企业数智驱动提升营销效果和客户体验。客户案例零售农文旅出行更多江南布衣全棉时代李宁优衣库都市丽人来伊份可口可乐谷雨如新完美帮助与文档产品简介帮助您快速了解营销智能推荐的定位、概述、优势以及具体功能。常见问题查看营销智能推荐购买与使用中的常见问题。感谢您的关注,请点击下方按钮,会有专人负责与您联系。立即咨询
产品概述-智能推荐平台-文档中心-腾讯云
产品概述-智能推荐平台-文档中心-腾讯云
腾讯云最新活动HOT产品解决方案定价企业中心云市场开发者客户支持合作与生态了解腾讯云关闭
搜索
智能推荐平台
{"list":[],"categoryId":1541,"title":"智能推荐平台","lang":"zh"}
文档中心
入门中心
API 中心
SDK 中心
我的反馈
智能推荐平台
文档中心
>
智能推荐平台
产品概述
最近更新时间:2023-03-22 14:46:01
微信扫一扫
新浪微博
复制链接
链接复制成功
我的收藏
智能推荐平台(Intelligent Recommendation Platform,IRP)集生态、技术、场景于一体,采用业界领先的 AI 学习技术和智能推荐算法,基于腾讯多年在超大型场景中积累的最佳实践方法论,助力客户业务实现增长的企业级应用产品。架构图产品功能功能描述说明业务与场景创建通过前端界面创建与用户场景对应的推荐应用。数据上报支持多种方式,按照推荐系统规定的数据格式上传数据。模型训练与结果获取通过算法生成模型并返回推荐结果。指标展示通过可视化图表展现业务指标变化。
查询
云服务器
网站备案
即时通信 IM
对象存储
计算
云服务器
轻量应用服务器
裸金属云服务器
GPU 云服务器
FPGA 云服务器
专用宿主机
弹性伸缩
自动化助手
操作系统与工具
腾讯 Kona
TencentOS Server
计算加速套件 TACO Kit
高性能计算
批量计算
高性能计算平台
高性能计算集群
高性能应用服务
分布式云
本地专用集群
边缘可用区
云托付物理服务器
专属可用区
云上网络
负载均衡
私有网络
弹性网卡
NAT 网关
网络流日志
Anycast 公网加速
共享带宽包
共享流量包
弹性公网 IPv6
弹性公网 IP
私有连接
混合云网络
专线接入
云联网
对等连接
VPN 连接
SD-WAN 接入服务
5G入云服务
数据分析
弹性 MapReduce
Elasticsearch Service
腾讯云数据仓库 TCHouse-P
腾讯云数据仓库 TCHouse-C
腾讯云数据仓库 TCHouse-D
流计算 Oceanus
数据湖计算 DLC
数据开发与治理
大数据处理套件 TBDS
数据开发治理平台 WeData
数据集成
数据应用与可视化
移动推送
腾讯云 BI
腾讯云图数据可视化
大数据可视交互系统
RayData 网页版
RayData 企业版
安全运营
网络入侵防护系统
高级威胁检测系统
威胁情报云查与本地引擎
安全运营中心
威胁情报攻击面管理
威胁情报中心
安全湖
终端安全
主机安全
容器安全服务
微隔离服务
应用安全
移动应用安全
应用安全开发
二进制软件成分分析
业务安全
标准兼容测试
专家兼容测试
远程调试
手游安全测试
服务性能测试
品牌经营管家
游戏安全
风控平台
流量反欺诈
验证码
小程序安全
文本内容安全
图片内容安全
音频内容安全
视频内容安全
营销号码安全
业务风险情报
联邦学习
全栈式风控引擎
腾讯安心用户运营平台
应用合规平台
账号风控平台
设备安全
云安全
Web 应用防火墙
云防火墙
漏洞扫描服务
云安全中心
API 安全治理
数据安全
数据安全治理中心
堡垒机
数据安全审计
数据脱敏
证书监控 SSLPod
云加密机
密钥管理系统
凭据管理系统
数据保险箱
代码签名证书
云证通
邮件证书
云访问安全代理
机密计算平台
安全服务
安全专家服务
安全托管服务
应急响应服务
安全攻防对抗服务
重要时期安全保障服务
渗透测试服务
云安全风险巡检服务
安全验证服务
暴露面管理服务
漏洞治理服务
身份安全
数字身份管控平台(员工版)
边缘安全
DDoS 防护
零信任
iOA 零信任安全管理系统
企业移动管理
容器
容器服务
容器镜像服务
Serverless
云函数
Serverless 应用中心
Serverless HTTP 服务
Serverless SSR
消息队列
消息队列 CKafka 版
消息队列 RocketMQ 版
消息队列 RabbitMQ 版
消息队列 Pulsar 版
消息队列 CMQ 版
微服务工具与平台
微服务引擎 TSE
弹性微服务
API 网关
微服务平台 TSF
服务网格
基础存储服务
对象存储
云硬盘
文件存储
归档存储
云 HDFS
数据加速器 GooseFS
存储数据服务
日志服务
智能媒资托管
数据万象
图片审核
视频审核
音频审核
文本审核
文档审核
图片处理
多媒体处理
文档服务
内容识别
数据迁移
迁移服务平台
云数据迁移
混合云存储
存储网关
存储一体机
备份一体机
并行文件一体机
智能存储
智能视图计算平台
关系型数据库
TDSQL-C MySQL 版
TDSQL-C PostgreSQL 版
云数据库 MySQL
云数据库 MariaDB
云数据库 SQL Server
云数据库 PostgreSQL
企业级分布式数据库
TDSQL MySQL版
TDSQL PostgreSQL版
TDSQL-H LibraDB
TDSQL-A ClickHouse 版
NoSQL 数据库
云数据库 Redis
云数据库 MongoDB
云数据库 Memcached
时序数据库 CTSDB
云数据库 Tendis
游戏数据库 TcaplusDB
云数据库 KeeWiDB
向量数据库
数据库软硬一体
数据库一体机 TData
云数据库独享集群
数据库 SaaS 服务
数据传输服务
数据库专家服务
数据库智能管家 DBbrain
数据库审计
数据库管理
数据库备份服务
数据库分布式云
数据库分布式云中心
低代码
云开发 CloudBase
腾讯云微搭低代码
静态网站托管
云托管 CloudBase Run
Web 应用托管
云资源管理
访问管理
操作审计
账号威胁发现
集团账号管理
商业流程服务
配置审计
云顾问
API 中心
SDK 中心
标签
控制中心
地域管理系统
云资源自动化 for Terraform
安全凭证服务
监控与运维
腾讯云可观测平台
应用性能监控
前端性能监控
云拨测
云压测
Prometheus 监控服务
Grafana 服务
混沌演练平台
腾讯云健康看板
TRTC 云助手
开发者工具
CODING DevOps
腾讯云小程序平台
腾讯云代码分析
Cloud Studio(云端 IDE)
腾讯云遨驰终端
移动开发平台
云应用
设计协同管理工具
设计协作平台
API 与工具
腾讯云助手
云 API
命令行工具
视频服务
智能创作
云直播
云点播
云点播-混合云版
腾讯云智绘
视频终端
音视频终端 SDK(腾讯云视立方)
音视频通话 SDK
直播 SDK
短视频 SDK
腾讯特效 SDK
播放器 SDK
虚拟形象 SDK
多人音视频房间 SDK
媒体处理
云游戏
媒体处理
极速高清
智能识别
智能审核
智能编辑
媒体处理企业版
X-P2P
云桌面
应用云渲染
内容创作
VR 实景漫游
音速达直播音乐版权引擎
实时互动
实时音视频
游戏多媒体引擎
实时互动-工业能源版
实时互动-教育版
云通信
即时通信 IM
短信
语音消息
邮件推送
号码认证
云联络中心
域名管理
域名注册
云解析 DNS
移动解析 HTTPDNS
私有域解析 Private DNS
智能全局流量管理
DNSPod
区块链
腾讯云区块链服务平台 TBaaS
动产质押区块链登记系统
区块链可信取证
分布式身份
至信链版权存证
可信计算服务
跨链服务平台
网站与备案
ICP 备案
SSL 证书
腾讯云建站
网站建设
CDN 与边缘平台
边缘安全加速平台 EO
内容分发网络 CDN
全站加速网络
安全加速 SCDN
多网聚合加速
全球应用加速
边缘计算
边缘计算机器
物联网边缘计算平台
金融服务
腾讯微卡收付通
云支付
金融专有云开发测试平台
供应链金融
企业金融服务平台
教育服务
智聆口语评测
数学作业批改
英文作文批改
互动白板
零售服务
智慧零售增长平台 Lite 版
移动服务
腾讯客户端性能分析
建筑服务
微瓴同业开放平台
商场客留大数据
政务服务
智慧党建
腾讯数字农村
医疗服务
智能导诊
AI 就医助手
AI 临床助手
智能预问诊
医疗报告结构化
精准预约
医疗数据中台
医疗内容平台
药械会议管理
药械客户管理
多渠道营销
腾讯健康组学平台
数智医疗影像平台
家医助手
文旅服务
文旅客情大数据
能源服务
腾讯智慧能源连接器
碳引擎
腾讯智慧能源数字孪生
腾讯智慧能源能碳工场
工业服务
云端智造协同平台
科创服务
材料研究平台
AI 基础产品
人脸识别
人体分析
文字识别
图像标签
图像搜索
图像识别
视频理解
图像处理
人脸融合
人像变换
人脸试妆
AI 绘画
视频创作
语音识别
语音合成
声音复刻
声音定制
音色变换
NLP 服务
机器翻译
AI 应用产品
人脸核身
对话机器人
智能硬件 AI 语音助手
腾讯灯塔智能数据洞察
腾讯同传
腾讯云小微智能增长套件
搜狗输入法企业版
智能扫码
增值税发票核验
智能结构化
办公文档还原
文本图像增强
AI 平台产品
TI-ONE 训练平台
TI-Matrix 应用平台
TI-ACC 加速工具
TI-OCR 训练平台
腾讯云智能数智人
腾讯云小微
腾讯觅影开放实验平台
企点商通
商通基础
金融行业-QTrade
电子行业-腾采通
印刷行业-网印通
货代行业-货代 Q 宝
货代行业-货客通
企点分析
客户数据平台
AB 实验平台
行为分析
会话分析
画像分析
增强分析
企点营销
客户忠诚度管理
营销智能推荐
营销云 SCRM
互动营销
数字会展
营销自动化
腾讯混元大模型
腾讯混元大模型
企业应用
腾讯问卷
办公协同
腾讯电子签
腾讯会议
腾讯文档企业版
TAPD 敏捷项目管理
腾讯HR助手
腾讯云企业网盘
腾讯云安灯
腾讯浏览服务
腾讯微卡
腾讯云 CA
连接器
账号连接器
腾讯轻联
数字营销
腾讯优码
Web3.0 数字营销平台
腾讯企点营销通
CRM
腾讯企点客服
物联网
物联网开发平台
物联网智能视频服务(行业版)
物联网设备洞察
物联网智能视频服务(消费版)
物联设备服务
物联网通信
腾讯物联网终端操作系统
物联网络管理服务
LPWA 物联网络
私有云
腾讯专有云企业版
TDSQL MySQL 版(私有云)
微服务平台 TSF(私有云)
更多
通用解决方案
直播安全
品牌保护
腾讯安心平台
企业共享服务中心
行业解决方案
金融云
直播录制
在线教育互动课堂
沉浸式媒体
电商
微信解决方案
小程序 · 云直播
用户服务
账号相关
控制台相关
消息中心
计费相关
购买指导
活动相关
服务计划
护航服务
联系我们
云生态
云市场
产业互联网学堂
腾讯云开发者
渠道合作伙伴
更多
认证信息
政策与规范
分析师报告
词汇表
本页目录
智能推荐平台
关闭
文档首页
关闭
智能推荐平台
Copyright © 2013 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
京公网安备 11010802017518
粤B2-20090059-1
中国站
中文
International
智能推荐系统研究综述
智能推荐系统研究综述
计算机系统应用 2022, Vol. 31 Issue (4): 47-58
引用本文
胡琪, 朱定局, 吴惠粦, 巫丽红. 智能推荐系统研究综述. 计算机系统应用, 2022, 31(4): 47-58.http://www.c-s-a.org.cn/1003-3254/8403.html
Hu Q, Zhu DJ, Wu HL, Wu LH. Survey on Intelligent Recommendation System. Computer Systems and Applications, 2022, 31(4): 47-58(in Chinese).http://www.c-s-a.org.cn/1003-3254/8403.html
智能推荐系统研究综述
胡琪1, 朱定局1, 吴惠粦2, 巫丽红3
1. 华南师范大学 计算机学院, 广州 510630;
2. 广州国家现代农业产业科技创新中心, 广州 510030;
3. 广东农工商职业技术学院, 广州 510507
收稿日期:2021-06-11; 修改日期:2021-07-14; 采用时间:2021-07-20; csa 在线出版时间:2022-03-22
基金项目:中国高等教育学会专项课题(2020JXD01); 广东省普通高校“人工智能”重点领域专项(2019KZDZX1027); 广东高校省级重点平台和重大科研项目(2017KTSCX048); 广东省公益研究与能力建设(2018B070714018); 广东省中医药局科研项目(20191411); 广东省高等学校产业学院建设项目(人工智能机器人教育产业学院)
通讯作者:朱定局, E-mail:
zhudingju@m.scnu.edu.cn.
摘要:伴随着电子商务平台和新型数字媒体服务迅速发展, 网络数据规模持续增长, 数据类型呈现多样化, 如何从大规模数据中挖掘有价值的信息, 已经成为信息技术的一项巨大挑战. 推荐系统能够缓解“信息过载”问题, 挖掘数据潜在价值, 将个性化信息推送给有需要的用户, 提高信息利用率. 深度学习的表征能力与推荐系统相融合, 有助于深层次地挖掘用户需求, 提供精准的个性化推荐服务. 本文首先分析传统推荐算法的优缺点, 再总结深度学习技术在推荐系统中的研究进展. 最后, 分析和展望智能推荐系统未来发展方向.
关键词:
推荐系统 深度学习 信息过载 推荐算法 个性化 协同过滤 目标检测
Survey on Intelligent Recommendation System
HU Qi1, ZHU Ding-Ju1, WU Hui-Lin2, WU Li-Hong3
1. School of Computer Science, South China Normal University, Guangzhou 510630, China; 2. Guangzhou National Modern Agricultural Industry Technology Innovation Center, Guangzhou 510030, China; 3. Guangdong Vocational College of Agriculture, Industry and Commerce, Guangzhou 510507, China
Abstract:
With the rapid development of e-commerce platforms and new digital media services, the scale of network data continues to grow and data types are diversified. The mining of valuable information from large-scale data has become a huge challenge for information technology. Recommendation systems can alleviate the “information overload” problem, explore the potential value of data, push personalized information to users in need, and improve information utilization. The combination of the representational capabilities of deep learning and recommendation systems helps to dig deeper into user needs and provide accurate personalized recommendation services. This study analyzes the advantages and disadvantages of traditional recommendation algorithms, summarizes the research progress of deep learning technology in recommendation systems, and probes into the future development directions of intelligent recommendation systems.
Key words:
recommendation system
deep learning
information overload
recommendation algorithm
personalization
collaborative filtering
target detection
1 引言
互联网信息服务不断扩展, 为用户提供更多的信息服务, 也加快数据规模的增长. 互联网数据包括用户个人信息, 浏览记录、消费历史、项目属性等数据, 如果不对这些数据加以利用, 会极大地浪费存储资源, 造成“信息过载”问题[1]. 推荐系统技术能够挖掘数据隐含价值, 协同用户数据和项目属性捕捉客户的需求, 提供个性化信息服务. 让用户获取所需要的信息, 从而提高数据的有效利用率. 推荐系统在缓解数据过载的问题中发挥着重要作用, 能够协助用户发现潜在的兴趣[2], 缓解数据过量导致用户无法发现自己需要的信息.
推荐系统已经成为许多电子商务和多媒体平台的内核, 个性化推荐服务能够帮助平台吸引用户的注意力, 提高用户访问量. 推荐系统为网络平台的发展提供源源不断的动力, 其商业价值也引起工业界和学术界的关注. 深度学习作为一项热门技术, 已经在计算机视觉、自然语言处理等多个领域展现出无限潜力, 也为推荐系统提供了新的方法[3]. 凭借深度学习技术的强大表征能力, 学习用户和项目的隐向量表示, 挖掘用户的历史行为数据、商品的多样化数据以及上下文场景信息, 捕获用户潜在偏好, 向用户生成更加精确的个性化推荐列表.
本文主要综述推荐系统的发展脉络, 总结传统的推荐算法的优缺点, 分析深度学习技术在推荐系统中的前沿应用, 并且展望深度学习推荐算法未来研究方向.
2 传统推荐算法
2.1 协同过滤
协同过滤[4]是早期使用最为广泛的推荐算法, 核心思想是综合用户和项目显式反馈信息, 筛选出目标用户可能感兴趣的项目进行推荐. 协同过滤算法主要类型可分为基于用户的协同过滤和基于物品的协同过滤, 两种类型的算法都需要基于构建的用户和项目的二元共现矩阵, 协同整个矩阵数据去预测用户对项目的评分. 基于用户的协同过滤, 需要计算用户之间的相似度, 找到与目标用户类似的用户, 加权求和相似用户的评分作为目标用户对项目的预测评分, 对评分排序生成推荐项目列表. 2003年, Amazon团队[5]发表关于协同过滤的论文, 介绍基于物品的协同过滤在商品推荐服务中的应用. 该算法基于共现矩阵, 找到目标用户评价高的物品, 利用物品向量计算物品之间的相似度, 最终将与高评分物品的类似物品作为推荐列表的结果. 协同过滤算法具备可解释性, 能够发掘出用户新的兴趣点, 但随着用户和物品的规模增大, 共现矩阵数据会变得更加稀疏, 计算相似度时准确率会降低, 影响算法实际效果. 且推荐结果的头部效应明显, 评分高的受欢迎物品会多次推荐, 而评分信息少的新物品较少推荐, 算法泛化能力较差.
2.2 矩阵分解
2006年, 矩阵分解[6]算法在用户评分预测任务中表现出色, 缩小预测评分与用户真实评分的误差. 算法主要思想是通过分解共现矩阵, 为用户和项目分别生成一个隐向量, 使用隐向量表示用户的兴趣和项目的属性, 用于挖掘用户与项目之间深层次潜在关系, 从而提高预测准确性. 矩阵分解算法通过使用奇异值分解(SVD)、特征根结构分解(ED)等方法分解共现矩阵分别得到用户隐向量
$ p_{u} $
和物品的隐向量
${q_i} $
, 用户向量与项目向量间的点积为用户对项目的预测评分, 物品预测值和真实值之差作为损失函数, 如式(1):
$ {e}_{u i}=r_{u i}-q_{i}{ }^{\rm T} p_{u} $
(1)
其中,
$ {r}_{u i} $
为用户u对物品i真实评分标签,
${p_u} $
与
${q_i} $
分别为用户和物品向量,
${p_u} $
与
${q_i} $
的点积作为用户u对物品i的预测评分. 使用梯度下降算法训练模型, 加入正则化项防止过拟合. 相较于协同过滤算法, 矩阵分解泛化能力更强, 缓解数据稀疏问题. 空间复杂度更低, 只需保存用户和项目向量. 矩阵分解算法分解得出的向量隐含用户信息和项目信息, 但隐向量缺乏可解释性. 矩阵分解仅利用用户与项目的评分信息, 没有使用其他相关特征信息, 损失了有用信息, 且无法有效解决冷启动问题.
2.3 逻辑回归模型
协同过滤和矩阵分解算法只利用用户与项目的交互信息, 而逻辑回归(logistic regression, LR)[7]模型能融合用户画像特征、物品属性、上下文信息, 将特征转化为数值向量, 输入到网络中训练, 学习各个特征的权重, 输出层预测样本为正的概率. 逻辑回归模型有益于并行化计算, 模型较为简单易于部署而广泛应用, 但表征能力有限, 没有进行多特征交叉组合, 特征筛选, 影响预测准确性. 2017年, 阿里巴巴团队[8]提出混合逻辑回归模型(mixed logistic regression, MLR), 由于传统的逻辑回归模型表达能力有限, 无法拟合复杂非线性表达式, MLR模型吸收“分而治之”的思想, 将特征空间分成几个区域, 在每个区域训练一个线性模型, 将不同区域的线性模型结果进行加权求和作为最终的输出结果. 只要MLR模型具有足够的分割区域, 可以拟合任意非线性函数. 相较于传统的LR模型, MLR模型可以扩展到大量样本和高维特征, 在稀疏数据中学习数据的非线性表示.
2.4 因子分解机模型
2010年, Rendle[9]提出因子分解机模型, 在逻辑回归的基础上, 加入二阶交叉特征组合. FM算法为每一个特征引入了一个具有低维稠密的隐向量特征, 并使用向量特征的内积作为特征交叉的权重, 如式(2). 即使两个特征共同存在的数据较少, 也可以衡量两者之间的相关性, 从而缓解了数据稀疏所导致的难以计算特征交互的问题. 相较于逻辑回归模型, FM模型表达能力更强. 但受限于组合爆炸问题, 导致特征组合无法扩展到三阶及以上.
$ \hat {{y}}(x) = {w_0} + \sum\limits_{i = 1}^n {{w_i}} {x_i} + \sum\limits_{i = 1}^n {\sum\limits_{j = n + 1}^n {\left\langle {{v_i},{v_j}} \right\rangle {x_i}{x_j}} } $
(2)
其中,
$ w_{0} $
为全局偏置,
${{w_i}} $
表示第i个特征的权重,
${\left\langle {{v_i},{v_j}} \right\rangle } $
为特征隐向量
${{v_i}{v_j}} $
的内积, 内积值作为特征交叉的权重, 最终预测值
$\hat {{y}}(x)$
为一阶特征与二阶交叉特征求和. 在FM模型基础上, FFM模型[10]把相同性质的特征归为同一个域, 细化特征组合的表示. 每个隐向量对应一个域, 当两个特征
${x_i} $
和
${x_{i + 1}} $
组合时, 用特征对应域的隐向量内积作为权重. FFM模型精细化表示特征组合, 同时也扩大了训练参数量, 增加了过拟合的风险.
2.5 GBDT+LR组合模型
2014年, Facebook团队[11]将梯度提升决策树与逻辑回归结合起来, 使用组合模型完成推荐任务, 模型结构如图1所示. 该模型的主要思想是使用梯度提升决策树进行自动化特征工程, 提取重要特征和进行特征组合, 树的最后一层叶节点生成新的离散特征, 作为逻辑回归模型的输入据经过激活函数后输出预测结果. 该组合模型的提出, 推进了特征工程模型化进程, 能够减少人工进行特征组合和特征筛选的工作量, 实现模型端到端训练.
图 1
Fig. 1
图 1 GBDT+LR组合模型结构
总的来说, 传统推荐算法种类繁多, 具有不同的优势, 需要结合实际的推荐场景加以灵活运用, 表1列出各个算法的优势和存在的劣势.
表 1(Table 1)
表 1 传统推荐算法对比
传统推荐算法
优势
劣势
协同过滤算法
算法简单
数据稀疏
不需要领域知识
冷启动问题
能发掘新的兴趣点
头部效应明显
矩阵分解算法
泛化能力加强
损失其它相关用户物品和上下文信息
缓解数据稀疏问题
缺乏解释性
泛化能力加强
损失其它相关用户物品和上下文信息
逻辑回归模型
模型简单, 易于实现
表达能力较差
学习各个特征权重, 具有可解释性
没有进行特征组合和特征筛选
模型简单, 易于实现
表达能力较差
因子分解
机模型
解决稀疏数据交叉特征组合问题
模型参数多, 训练困难
模型表达能力增强
容易过拟合
无法学习三阶及以上特征
梯度提升树+
逻辑回归
组合模型
自动化特征组合
泛化能力差
端到端训练
容易过拟合
减少手工特征组合
表 1 传统推荐算法对比
3 深度学习技术
深度学习技术已经在人工智能领域取得很多研究成果, 深度学习与推荐系统相结合, 能够缓解传统推荐模型表达能力不足的问题. 深度学习的表征能力更强, 需要大量数据训练模型, 能够缓解数据规模大和数据稀疏问题. 深度学习的基本结构有: 多层感知机、卷积神经网络、循环神经网络、注意力机制等.
3.1 多层感知机
多层感知机是前馈结构的神经网络, 数据通过输入层, 经过多个隐藏层, 汇入输出层计算最终结果, 网络结构如图2所示, 利用BP反向传播算法来监督训练神经网络, 调整每层神经元的权重, 拟合非线性函数, 缩小预测值与真实值的误差. 多层感知机在推荐系统中常用于挖掘高阶特征交叉[12], 学习潜在数据模式.
3.2 卷积神经网络
卷积神经网络CNN是模仿生物视觉系统构建的网络结构[13], 使用卷积操作处理二维数据特征, 在计算机视觉领域应用广泛. CNN中的卷积运算的参数共享减少了模型中需要学习的参数数量, 相较于全连接神经网络计算效率更高. 在推荐系统中卷积神经网络主要用于提取视觉特征、文本特征, 融合用户画像特征, 从更多方面捕获用户偏好, 常应用于图片推荐、新闻推荐、多模态推荐等场景.
3.3 循环神经网络
循环神经网络RNN是一种常用于处理时间序列数据的深度网络结构, 结构如图3所示. RNN不仅能够进行前馈计算, 且能够保持上个时刻的信息, 利用历史状态数据和当前状态预测输出[14], 因此可以处理文本和音频等序列数据.
图 2
Fig. 2
图 2 多层感知机结构
图 3
Fig. 3
图 3 循环神经网络结构
为了解决时间间隔过长导致的信息流失问题和梯度消失与爆炸问题, 构建出新的变体长短期记忆网络(LSTM)[15]和门控循环单元(GRU)[16]. 在推荐系统中, 循环神经网络可用在基于会话推荐, 基于用户当前会话行为, 学习用户的兴趣迁移过程, 预测用户下一个可能交互的项目.
3.4 注意力机制
注意力机制是一种模仿人类视觉的局部信号处理机制, 人在观察事物过程中通常关注于部分重要信息, 减少对无关信息的注意力, 从而快速做出判断. 注意力机制帮助推荐模型选择更有效的特征, 让模型关注于更重要信息, 减小数据噪声对结果的影响[17]. 深度学习的训练过程常被看做“黑盒”, 整个训练过程无法预知, 输出的结果无法提供很好的解释性. 深度推荐模型与注意力机制结合, 有利于增强模型的可解释性, 对各种特征赋予不同的注意力分数, 增强有效特征的影响力, 抑制数据噪声, 提升模型的推荐准确性.
4 深度学习在推荐系统中的应用
传统的推荐算法结构简单, 容易实现, 可以灵活运用于推荐任务. 然而在大数据的背景下, 传统推荐模型能力有限, 泛化能力较差, 无法很好应用在大规模数据和数据稀疏场景. 深度学习技术有助于推荐系统应用于大规模数据场景中, 深度学习深层复杂网络结构需要大量数据训练整个模型, 稀疏特征可以借由神经网络转换为蕴含丰富信息的低维度稠密向量. 复杂网络结构能够拟合任意非线性函数, 挖掘数据深层次的潜在模式. 深度学习模型可扩展性强, 能融合多种异构数据, 从多方面捕获用户兴趣, 提高模型的预测准确度. 本节主要分析深度学习在推荐场景中的应用.
4.1 嵌入技术在推荐系统中的应用
推荐系统通常使用嵌入(embedding)技术用低维度稠密向量去表征一个对象, 该对象可以是一个项目、一个用户等, 同时向量之间的距离隐含项目与项目之间、用户与用户之间、用户与项目之间的关系. 嵌入技术已经成为推荐系统中必不可少的环节, 主要处理稀疏特征, 融合大量信息形成一个有价值的低维向量, 输入到神经网络中训练模型. 也可以利用向量之间的关系, 作为召回策略, 筛选出与用户兴趣匹配的候选项目.
Grbovic等人[18]在房屋短租平台应用嵌入方法表征用户和推荐列表. 在Skip-Gram的基础上, 针对该平台在搜索排序和推荐实时个性化中设计了列表和用户的嵌入向量. 用户的搜索会话中的数据作为类似序列信息, 使用词向量[14]方式学习每个房源的嵌入向量, 有效表征房源多个特征, 结合实际业务场景, 向用户精确推荐优质房源.
阿里巴巴团队[19]利用嵌入技术用于学习ID类型数据的表示, 用于电商场景的推荐, 包括用户ID、商品ID、种类ID等, 传统的独热编码方式会导致数据过于稀疏, 且无法表示对象之间的潜在关系, 在电子商务平台中, ID类数据非常稀疏, 动辄达到几亿维度, 需要使用低维度的向量高效表达ID数据. 该文基于Item2Vec[20]提出基于嵌入的框架, 通过采集用户行为的ID序列, 结合ID之间的结构化的联系, 能够为不同类型的ID学习一个低维向量用以表示. 在此基础上, 阿里巴巴团队[21]提出基于图的嵌入方法用于推荐系统, 为了解决阿里电商数亿规模的数据稀疏、数据量大以及存在的商品冷启动问题. 该方法首先基于会话构造一个商品有向图, 基于图构造与商品有交互的行为序列, 结合特征生成项目的图嵌入向量, 对每个向量进行特征加权. 该算法主要用于召回阶段, 基于与用户有过交互的商品, 召回相关候选项目.
Wu等人[22]提出SR-GNN模型, 考虑到物品转换成向量的复杂过程, 提出一种新的嵌入方式, 使用图数据结构对用户会话进行建模, 利用图神经网络学习图中节点的嵌入向量. 最后, 通过注意力机制把每个会话表征为当前会话的兴趣和全局兴趣的构成, 基于每个会话, 预测下一个项目交互概率. 该模型克服难以用隐向量表示项目的问题, 使用图结构模型生成精准项目嵌入向量, 为基于会话的推荐场景提供新的方法.
4.2 基于多层感知机的推荐模型
多层感知机模型在推荐系统中应用广泛, 通常原始数据经过嵌入层形成向量后, 会输入到多层感知机中, 学习数据非线性表示, 在进行低阶特征交叉后, 结合多层感知机进一步提取高阶特征交叉[23], 可应用在预测用对项目评分、精准排序任务和用户点击率预测.
2016年, YouTube团队[24]将DNN应用在视频推荐服务中, 用神经网络对候选视频进行预测评分, 根据分数排序生成推荐列表. YouTube平台的用户数量和视频规模庞大, 传统小规模数据集的算法并不适用, 同时平台的视频更新速度快, 需要平衡已有视频和新发布的视频所带来的冷启动问题, 追踪用户的实时行为. 推荐平台架构如图4所示.
图 4
Fig. 4
图 4 YouTube平台架构
整个系统分为匹配阶段和排序阶段, 匹配阶段利用高效召回策略从百万级规模的视频库中召回用户可能感兴趣的候选项, 该阶段要求搜索效率高, 并且检索出的视频与用户的历史行为和偏好相关. 排序阶段主要是对召回的视频进行精粒度的打分排序, 将神经网络融合用户特征、视频属性和场景信息输入到模型中, 对候选视频进行评分预测, 依据分数进行排序, 选取高评分视频作为推荐列表.
Cheng等人[25]提出深广(Wide & Deep)模型, 模型由Wide部分和Deep部分构成, 模型结构如 图5所示, 其中Wide部分使用线性模型, 提取数据的一阶特征, Deep部分使用神经网络自动学习高阶特征提高泛化能力, 最终将两个部分的结果整合通过Sigmoid激活函数后输出预测结果. 模型中的Wide部分对应于模型的记忆能力, 从用户的数据中发现特征之间的相关性, 偏向于推荐和用户历史行为相关的内容. Deep部分对应于模型的泛化能力, 稀疏特征经嵌入层形成低维稠密向量输入到隐藏层中, 利用神经网络的学习能力捕获新的潜在高阶特征组合, 泛化能力有利于推荐结果个性化, 让推荐结果具有多样性.
图 5
Fig. 5
图 5 Wide & Deep模型结构
多层感知机模型广泛应用于点击率预估任务, 能够充分利用用户画像特征、项目属性特征和上下文信息, 进行特征提取, 且能缓解数据稀疏、高阶特征组合等问题. 多层感知机与因子分解机进行结合, 可以弥补FM和FFM模型中特征组合无法扩展到三阶及以上的劣势. 通常在稀疏特征经过嵌入层转化为低维向量后, 进行低阶交叉特征组合并且利用DNN提取高阶特征组合, 经过Sigmoid函数输出点击概率, 例如DeepFM[26]、FAT-DeepFFM[27]、NFM[28]等模型. 协同过滤与神经网络相结合, 缓解稀疏特征导致的训练困难问题, He等人[29]提出神经协同过滤模型, 将矩阵分解的处理方式和深度学习融合, 模型结构如图6. 神经协同过滤模型主要对隐式反馈数据进行建模, 用嵌入向量表征用户和物品, 输入到多层神经网络中, 输出层预测用户评分, 采用平方损失函数训练模型. 利用神经网络学习隐向量表示用户和项目之间潜在关系, 将用户和项目映射到隐向量空间, 向量之间的距离反映出用户和项目的潜在关系, 可用于召回阶段, 计算相关性召回与目标用户相关项目候选集合.
图 6
Fig. 6
图 6 NCF模型结构
Wang等人[30]针对点击率预估任务, 讨论归一化操作对于点击率预估效果的影响, 如层归一化、批次归一化、仅有方差的归一化. 通过对比实验, 将对向量化之后的特征进行归一化, 连续数值型特征使用层归一化, 稀疏分类性特征做批次归一化, 在多层感知机中使用偏差的归一化能够提升点击率预测准确性.
Huang等人[31]借鉴计算机视觉和自然语言处理中的门机制, 提升非凸神经网络的可训练性, 在嵌入层增加门机制, 用于从特征选择更重要的特征, 在隐藏层加入门机制, 用于筛选更加重要的特征交互传递到更深层的网络. 门机制的思想类似于注意力机制, 增强有效特征, 抑制数据噪声.
4.3 基于卷积神经网络的推荐系统
卷积神经网络的卷积和池化计算主要学习数据局部特征[32], 可以提取非结构化多媒体数据, 对多源异构数据进行表征学习. 网络可以融合多样化信息, 如物品图像、评论文本等, 挖掘用户视觉兴趣或从文本信息中提取用户偏好. 卷积神经网络提高了模型的可扩展性, 融合更多信息能够让模型从更多方面捕捉用户兴趣. 在推荐系统中, 卷积神经网络适用于多模态推荐、图片推荐和文本推荐任务.
通常用户的行为容易受到图像的影响, 光鲜的商品图片往往能够吸引到用户的注意力. Zhou等人[33]尝试用卷积神经网络捕捉分析用户喜欢的图像来提取用户视觉兴趣画像, 该系统通过计算视觉兴趣向量的余弦相似性, 找到符合用户视觉兴趣的住房. 该模型应用于酒店预订系统, 用图像特征预测用户喜欢的住房风格, 实现个性化推荐. Tang等人[34]提出卷积序列嵌入推荐模型, 将用户过去交互的商品看成序列, 预测用户未来可能交互的项目, 其思想是将在时间和空间上最近的序列形成一个“图像”, 使用卷积滤波器学习序列模式作为图像的局部特征. 该模型使用卷积神经网络学习序列特征, 用隐因子模型学习用户特征.
有相关研究利用卷积神经网络抽取文本特征, 使模型融入文本信息, 向用户推荐相关感兴趣的文字内容. Shen等人[35]将CNN用于在线学习资源推荐中, 模型使用卷积神经从学习资源的介绍、内容等文本信息中提取项目特征, 对于输入采用语言模型, 对于输出采用L1范数正则化的潜在因子模型, 在此基础上引入分裂Bregman迭代法求解该模型, 给学生推荐正确的学习资源. Gong等人[36]采用带注意力的CNN处理标签推荐问题, 整个模型由两部分组成前一部分用于获取文本特征, 后一部分对各个文本的表示进行Softmax多标签分类. 将CNN模型卷积层应用在预训练词向量上, 加入注意力机制, 利用注意力层来产生一个单词相对于它周围的单词的权重.
Zheng等人[37]构建DeepCoNN模型使用文本评论对用户行为和商品属性进行联合建模. 两个神经网络顶部的额外共享层连接了两个并行网络, 因此用户和项目表示可以相互交互以预测点击率. 整个模型有3层组成Lookup层, CNN层, 输出层, Lookup层将用户评论和商品评论转化为对应词向量, 输入到CNN中, 最后的输出预测结果, 训练模型缩小误差.
Liu等人[38]提出FGCNN模型, 使用卷积神经网络提取局部模式并且组合生成新的特征, 为防止全局信息的丢失, 引入多层感知机提取全局特征交互, 最终在Criteo数据集中AUC达到80.22%的效果. 模型通过CNN与MLP相结合的方式学习有用的局部特征和全局特征, 既减少手工特征量, 又缓解因特征稀疏导致的神经网络训练困难问题.
2020年, 京东团队提出CSCNN模型[39], 有效利用电商平台中丰富的商品类目信息, 使用卷积神经网络提取图像信息, 创新性地将商品信息和商品主图作为图像特征提取模块的输入, 提取商品主图中丰富的视觉特征, 有效挖掘商品视觉属性, 学习商品图像对于用户行为的影响, 提高点击概率预测的准确性.
4.4 基于循环神经网络的推荐系统
多层感知机和卷积神经网络是前馈结构的网络, 层与层之间全连接, 但每层神经元节点之间无任何连接, 不利于建模文本或者音频等时序数据, 因此提出循环神经网络RNN, 处理时序数据. RNN的最大特点在于神经网络具有记忆性并且能够参数共享, 它能够获取某一时刻的输入数据和前一时刻的隐层状态来预测当前时刻的输出. 近年来, 循环神经网络已经在机器翻译、自然语言处理领域中取得很多研究进展. 在推荐系统中, 主要使用循环神经网络具有记忆性的特点对用户的历史会话序列建模, 学习用户偏好演变过程以及用户上下文相关兴趣, 应用于会话推荐任务.
在基于会话的推荐中, 用户的行为和兴趣随着时间推移不断改变, 用户当前行为与历史浏览和搜索行为具有较强联系. Hidasi等人[40]在短会话推荐任务中使用循环神经网络, 把用户与物品交互行为组成行为序列, 输入模型中训练, 预测下一项目交互概率. 该模型采用GRU模型作为基本单元, 引入会话并行小批量数据, 该模型采用GRU模型作为基础结构单元, 对小批量的输出采样, 使用排序损失函数训练模型, 拟合目标任务, 捕获用户兴趣随着时间推移的演变过程. Hidasi等人[41]在此基础上, 进一步优化采样方法和损失函数, 为解决训练过程中存在的梯度消失问题, 提出新的损失函数Top-Max和BPR-Max, 进一步提升模型训练效果.
Devooght等人[42]将协同过滤视为时间序列的预测问题, 应用LSTM捕捉用户的喜好演变过程. 每个项目用独热编码表示, 采样用户的历史行为作为时间序列, 将项目的向量输入到RNN模型中, 输出为每个项目对应神经元的Softmax值, 推荐输出层概率最大的若干个项目. Donkers等人[43]首次提出将用户编码信息融入GRU的网络结构中, 通过深度集成用户信息, 能够更有效的对用户行为序列建模. 通过改造GRU的门控结构, 整合用户信息以及行为序列到模型中, 完成个性化序列预测任务, 有效学习用户行为事件之间的隐藏关系, 预测用户兴趣进行下一项推荐.
考虑到过去的研究大多利用用户短期行为, 而没有考虑顾客长期稳定的偏好和演化过程. Li等人[44]提出BINN模型, 通过结合用户的偏好和当前消费动机来进行下一项推荐. 模型挖掘大量用户行为日志如浏览、点击、收藏等历史记录, 形成随时间推移的行为序列, 这些丰富信息有利于学习用户潜在兴趣. 使用新的神经物品嵌入方法, 获取统一的物品表示空间, 学习物品的潜在向量, 捕获物品之间的序列相关性. 开发出基于长短期记忆神经网络学习个人偏好和当前消费动机, 进行序列化推荐.
Feng等人[45]提出DSIN模型, 应用循环神经网络从用户行为序列中捕获动态不断变化的用户兴趣, DSIN模型能够有效对用户对个会话进行建模, 用于点击率估计预测. 用户的连续行为由多个历史会话组成, 用户在每个会话和异构交叉会话中的行为是高度同构的, 加入自注意力机制提取用户在每个会话中的兴趣, 应用双向LSTM来捕获上下文会话兴趣的顺序关系, 最后使用本地激活单元来聚合用户对目标项的不同会话兴趣表示, 完成基于会话的推荐.
4.5 基于注意力机制的推荐系统
用户的兴趣具有多样性, 并且会随时间不断变迁, 用户点击行为具有局部活跃性, 某一时刻点击行为仅仅和过去的部分历史数据有关, 而不是所有历史记录. Zhou等人[46]提出DIN模型, 模型中引入注意力机制, 对用户行为序列数据建模, 将用户行为基于注意力机制进行加权求和, 使模型更加关注有益信息, 预测下一次点击动作. 并且提出小批量正则方法和自适应激活函数辅助模型训练. 2018年, 在DIN模型基础上, 又设计出DIEN模型[47], 该模型使用GRU结构构建模型用户行为序列. DIEN设计了兴趣提取层, 捕获用户随时间改变的兴趣演变过程. 同时设计了兴趣演化层来捕获与目标项相关的兴趣演化过程. GRU每一步的局部激活都能增强相对兴趣的影响, 减弱用户兴趣迁移的干扰, 有助于充分学习相对于目标项目的兴趣演化过程.
阿里巴巴团队提出ATRank模型[48], 该模型基于注意力机制对用户异构行为序列建模, 融合用户不同的行为记录, 更好地理解用户兴趣, 提供更优质的个性化服务. 整个模型包括原始特征、语义映射层、自注意力层和目标网络. 语义映射层能让不同的行为可以在不同的语义空间下进行比较和相互作用. 自注意力层让单个的行为本身变成考虑到其他行为影响的记录. 目标网络则通过Vanilla Attention可以准确的找到相关的用户行为进行预测任务. 使用类似 Google 的自注意力机制去除 CNN、LSTM 的限制, 加快网络训练速度, 提升预测效果.
Xiao等人[49]提出AFM模型, 该模型将注意力机制与FM算法融合. 考虑到FM算法虽然高效, 但它对所有特征交互的建模具有相同权重, 可能会影响预测的准确性, 并不是所有特征交互都对预测结果有益且具有预测性. 无用特征之间的交互可能引入噪声, 从而降低模型性能. 所以在FM算法中加入注意力机制, 为每个交叉特征计算一个权重表示对预测结果的影响大小.
Song等人[50]提出AutoInt模型利用多头自注意力机制来完成自动特征提取. 高阶特征组合有利于提升点击率估计准确度, 但依靠经验进行人工特征组合工作量非常大. 该模型通过自注意力机制构建特征交互层, 交互层的层数可作为超参数调整, 交互层叠加可以学习二阶、三阶及以上高阶组合. 在第一层的交互中, 通过注意力映射可以学习不同特征的相关性, 以加权求和的方式进行组合. 同时使用残差连接防止交互层加深导致神经网络退化问题, 防止梯度弥散问题.
依据用历史行为记录, 建模用户偏好动态渐变过程, 是对推荐系统的巨大挑战. 现有算法使用序列神经网络, 遵从从左到右的顺序, 利用单向信息建模, 这种严格的顺序降低了历史序列的表示能力, 影响准确性. 2019年, Sun等人[51]提出Bert4Rec模型, 首次将BERT模型用于推荐系统, 由于深度双向信息会造成信息的泄露, 为了解决这个问题, 使用Cloze Task训练模型, 利用上下文信息预测Masked Item, 在预测过程中, 将Mask加入到输入序列的最后, 然后利用Mask的嵌入向量进行推荐.
多数点击概率估计模型只考虑某一广告的信息而忽略其他相关广告对预测结果, Ouyang等人[52]提出DSTN模型, 将不同类型的广告作为辅助信息融入到模型之中, 如用户历史点击或者曝光未点击的广告和当前上下文已经出现过的广告等, 加入注意力提取对目标广告有用的辅助信息, 减少噪声数据影响, 利用上下文信息提高模型准确度.
大多数深度学习推荐模型将原始稀疏特征嵌入到低维向量, 输入到神经网络中获得最终的推荐预测概率, 这些工作只是连接不同的特征, 忽略用户行为的连续性. DIN模型[41]提出使用注意力机制来捕获候选项与用户先前点击商品之间的相似性, 但未考虑用户行为序列背后的序列性质. 阿里巴巴团队[53]提出BST模型, 将Transformer技术应用于推荐系统中学习用户历史行为序列信息. 该模型相比于之前所提出的DIN模型准确率有较大提升. 数据经过嵌入层后, 输入到Transformer层, 该层用来捕获用户历史行为序列, 再与其他特征拼接输入到神经网络中进行训练.
4.6 树模型与推荐系统的结合
由于神经网络的训练过程不可预知, 推荐结果缺乏解释性, 目前很多的深度推荐模型如Wide & Deep [25]、DeepFM[26]等模型都是隐式地学习交叉特征, 可能引入数据噪声. 有相关研究将树模型用于有效的交叉特征, 将特征放入基于嵌入技术的注意力模型中, 不仅保障预测准确性, 也提高模型可解释性.
Wang等人[54]提出TEM模型, 使用树模型增强向量嵌入方法, 将嵌入技术和树模型的可解释的优点相结合. 该方法受到GBDT+LR组合模型的启发, 根据用户和物品的历史信息, 建立一个决策树来自动提取有效交叉特征, 将交叉特征输入到一个基于嵌入技术的神经注意力网络, 学习交叉特征的权重, 权重代表特征重要程度. 由于决策树提取的交叉特征明确, 而且注意力网络学习各个特征的权重, 增强模型可解释性.
阿里巴巴团队[55]提出一种基于树结构的TDM模型, 解决很多模型不能调节用户和商品向量之间的内在乘积形式以利用高效搜索算法, 因此不能用于大规模推荐系统中召回候选集. 其主要思想是通过海量商品信息构建兴趣树, 自顶向下遍历兴趣树的节点并为每个用户生成推荐项, 从粗到细地预测用户的兴趣. 该方法可以从大量商品中快速检索出用户感兴趣的若干商品, 常用于推荐系统中的召回阶段.
总而言之, 深度学习技术推动了推荐系统的发展, 扩展了推荐系统特征提取能力, 增强模型表达能力, 融合更多类型特征, 学习用户多方面兴趣, 提供更多个性化推荐方法, 表2总结各项深度学习技术与推荐系统融合的特点描述以及优缺点分析.
5 基于深度学习的推荐系统未来发展方向
深度学习模型具备强大的表达能力, 已经证明深度神经网络能够拟合复杂的非线性函数, 深度学习技术与推荐系统的融合. 传统的机器学习模型(如逻辑回归模型), 需要人工进行特征选择和特征交叉, 耗费大量人力, 利用神经网络对于高阶特征的自动提取和筛选, 捕获更有益的组合特征[56], 训练端到端模型, 减少人工特征工程的工作量, 节省投入成本. 深度学习模型可拓展性强, 可以在模型中融合多种异构数据, 让模型获得更多的信息, 提高预测结果的精确性. 以下总结了几个推荐系统未来的发展方向.
表 2(Table 2)
表 2 深度学习技术在推荐系统中应用对比
深度学习技术
特点描述
优点
缺点
嵌入技术[18-22]
将高维离散特征转换为低维度稠密
向量.
缓解独热编码造成的特征稀疏问题, 获取用户和项目的隐向量表示.
不同特征的嵌入维度难以确认, 嵌入向量的训练耗费大量时间和开销.
多层感知机[23-31]
前馈结构的神经网络, 数据通过输入层, 经过多个隐藏层, 汇入输出层计算最终结果.
结构灵活, 能够学习数据的非线性表达, 可以对高阶特征进行建模.
无法处理序列数据, 图像数据.
卷积神经网络[32-39]
具有卷积计算和池化操作的网络结构, 适用于二维图像数据局部特征的抽取.
能够提取图像特征、文本特征, 让模型能融入多样化数据, 捕捉用户更多兴趣.
CNN用于特征交互建模, 只能学习相邻特征之间部分特征交互.
循环神经网络[40-45]
具有记忆性、参数共享, 隐藏层节点之间有连接, 获取上一时刻信息并且结合当前状态预测输出.
能够对用户交互序列数据建模, 捕获用户偏好演变过程, 适用于基于会话的推荐任务.
短期记忆影响较大, 长期记忆影响小, 时序间隔变大会丢失远距离信息, 可能出现梯度消失和梯度爆炸问题.
注意力机制[46-53]
模仿人类视觉的局部信号处理机制, 对不同信息赋予不同权重, 使模型关注于更重要的信息.
计算注意力分数, 学习每个特征对于输出的影响程度, 协助模型捕获重要信息.
不能捕捉位置信息和学习序列中的顺序关系.
树模型[54, 55]
一种基于特征空间划分的具有树形分支结构的模型.
时间复杂度低, 能够处理数值型和类别性数据, 有较高可解释性.
抗干扰能力弱、最优决策划分是NP难问题、对数据不均衡类别倾向数据多的类别.
表 2 深度学习技术在推荐系统中应用对比
5.1 深度学习与传统推荐算法的结合
传统的推荐模型结构简单, 应用广泛, 但表示能力有限, 无法挖掘深层次的用户和项目隐向量表示和高阶特征. 传统推荐算法融合深度学习技术, 弥补传统算法的不足, 利用深度推荐模型融合多种类型异构数据, 让模型吸收更多信息提高准确率, 更好捕获用户和项目的特征. 因此, 深度学习与传统推荐算法的融合, 可以充分利用二者的特点. 虽然目前已有相关的研究成果, 如DeepFM[21]、NCF[24]、AFM[44]等模型, 但这个方向依然具有很大的发展空间, 未来可以探索传统推荐算法与更多的深度学习模型的结合, 提出新的深度推荐模型.
5.2 深度学习推荐系统的可解释性
基于深度学习的推荐模型可以利用多源异构数据预测用户的喜好, 但模型的训练过程就像一个“黑盒”, 模型的大规模权重参数根据目标任务自动调整, 很难对模型输出的结果给予合理解释, 因此深层的神经网络高度不可解释. 如何做出可解释的推荐还是一项艰难挑战. 然而向用户提供有价值的推荐解释是非常重要的方面, 让用户明白推荐的理由, 能够加强用户对产品的理解和信任, 提升用户体验感. 注意力模型在推荐系统上的应用从一定程度上缓解了推荐模型的不可解释性[57], 因此构建解释性更强的推荐模型, 让用户理解推荐理由, 也是未来的研究热点之一.
5.3 融合更多类型数据的新网络结构
随着互联网上的信息量不断增加, 数据类型也更加多样化, 可扩展性对于模型在实际应用中的可用性十分重要. 深度推荐模型的可扩展性, 可以帮助在模型中整合多种辅助信息, 更多异构数据输入模型可以让模型从更多方面学习用户的偏好, 给出准确的预测. 未来新的深度推荐模型可以融合多模态数据, 除了使用用户与项目之间的交互数据, 还可以利用用户的时空序列数据、图像信息、项目数据的动态变化等, 对多样化数据建模能够发掘用户新兴趣点. 因此, 研究新的深度推荐模型结构去融合多种数据源也是重要的研究领域.
5.4 跨领域信息融合
许多互联网平台提供各种信息资源和网络服务, 搜索引擎提供信息搜索服务、电子商务平台提供购物服务、新闻平台推送实时热点新闻. 然而单领域推荐系统只注重某一特定领域, 而忽略了用户在其他领域的兴趣, 加剧了数据稀疏性和冷启动问题[3]. 融合多个平台的用户信息可以进行跨领域推荐, 克服单一领域的数据稀疏, 利用多个领域的信息可以挖掘用户个性化偏好. 通过深度学习技术, 可以将各类数据以向量表示作为模型输入数据, 利用源领域学习到的数据协助目标领域作推荐[2]. 目前, 跨领域信息融合推荐方向的研究较少, 还有很大的探索空间和潜力.
5.5 新的训练优化方法与网络架构
推荐系统领域的研究, 深度学习技术在实际应用中通常会遇到两个挑战, 一是模型训练所耗费的资源多; 二是神经网络训练问题. 深度学习模型依赖大量数据进行训练, 需要足够的硬件资源来计算, 而且训练时间耗费的时间长, 同时参数调整难度大, 可能会出现收敛慢、易波动问题. 随着层数的增多, 可能出现过拟合问题. 在评估数据稀疏的情况下将导致推荐推荐模型训练不充分问题. 在之后的研究中可以尝试新的深度学习训练方法和优化策略, 在不损失预测准确度的情况下减少训练参数, 让模型变得更轻便[58], 使用负采样和剪枝算法对神经网络训练进行优化加速[59], 使用正则化方法[60]防止过拟合, 增强深度神经网络训练效果.
6 结语
在信息技术迅速发展的时代, 互联网中的数据量也呈爆炸式增长的趋势, 随之而来的“信息过载”问题无法避免, 推荐系统在缓解信息过载问题中发挥重要作用. 深度学习技术与推荐系统相融合, 构建贴合用户兴趣的模型, 产生个性化推荐列表. 相较于传统推荐算法, 深度学习增强了模型的可扩展能力和表征能力, 让模型能够融入更多样的特征, 捕获用户的兴趣, 提高模型预测准确度. 本文分析了传统推荐算法的优缺点, 在此基础上进一步分析深度学习推荐模型的研究进展, 讨论和分析了推荐算法的研究现状和未来发展. 希望本文能够为推荐算法领域的研究人员理清脉络, 提供有益的帮助.
参考文献
[1]
黄立威, 江碧涛, 吕守业, 等. 基于深度学习的推荐系统研究综述. 计算机学报, 2018, 41(7): 1619-1647. DOI:10.11897/SP.J.1016.2018.01619
[2]
Zhang S, Yao L, Sun AX, et al. Deep learning based recommender system: A survey and new perspectives. ACM Computing Surveys, 2019, 52(1): 5.
[3]
Mu RH. A survey of recommender systems based on deep learning. IEEE Access, 2018, 6: 69009-69022. DOI:10.1109/ACCESS.2018.2880197
[4]
Sarwar B, Karypis G, Konstan J, et al. Item-based collaborative filtering recommendation algorithms. Proceedings of the 10th International Conference on World Wide Web. Hong Kong: ACM, 2001. 285–295.
[5]
Linden G, Smith B, York J. Amazon. com recommendations: Item-to-item collaborative filtering. IEEE Internet Computing, 2003, 7(1): 76-80.
[6]
Koren Y, Bell R, Volinsky C. Matrix factorization techniques for recommender systems. Computer, 2009, 42(8): 30-37. DOI:10.1109/MC.2009.263
[7]
Richardson M, Dominowska E, Ragno R. Predicting clicks: Estimating the click-through rate for new ads. Proceedings of the 16th International Conference on World Wide Web. Banff: ACM, 2007. 521–530.
[8]
Gai K, Zhu XQ, Li H, et al. Learning piece-wise linear models from large scale data for ad click prediction. arXiv: 1704.05194, 2017.
[9]
Rendle S. Factorization machines. Proceedings of 2010 IEEE International Conference on Data Mining. Sydney: IEEE, 2010. 995–1000.
[10]
Juan YC, Zhuang Y, Chin WS, et al. Field-aware factorization machines for CTR prediction. Proceedings of the 10th ACM Conference on Recommender Systems. Boston: ACM, 2016. 43–50.
[11]
He XR, Pan JF, Jin O, et al. Practical lessons from predicting clicks on ads at Facebook. Proceedings of the Eighth International Workshop on Data Mining for Online Advertising. New York: ACM, 2014. 1–9.
[12]
Ruck DW, Rogers SK, Kabrisky M. Feature selection using a multilayer perceptron. Neural Network Computing, 1990, 2(2): 40-48.
[13]
de Andrade A. Best practices for convolutional neural networks applied to object recognition in images. arXiv: 1910.13029, 2019.
[14]
Medsker LR, Jain LC. Recurrent Neural Networks: Design and Applications. New York: CRC Press, 2001. 64–67.
[15]
Hochreiter S, Schmidhuber J. Long short-term memory. Neural Computation, 1997, 9(8): 1735-1780. DOI:10.1162/neco.1997.9.8.1735
[16]
Cho K, van Merriënboer B, Gulcehre C, et al. Learning phrase representations using RNN encoder-decoder for statistical machine translation. arXiv: 1406.1078, 2014.
[17]
陈海涵, 吴国栋, 李景霞, 等. 基于注意力机制的深度学习推荐研究进展. 计算机工程与科学, 2021, 43(2): 370-380.
[18]
Grbovic M, Cheng HB. Real-time personalization using embeddings for search ranking at airbnb. Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. London: ACM, 2018. 311–320.
[19]
Zhao K, Li YC, Shuai ZQ, et al. Learning and transferring IDs representation in E-commerce. Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. London: ACM, 2018. 1031–1039.
[20]
Barkan O, Koenigstein N. ITEM2VEC: Neural item embedding for collaborative filtering. Proceedings of 2016 IEEE 26th International Workshop on Machine Learning for Signal Processing. Vietri sul Mare: IEEE, 2016. 1–6.
[21]
Wang JZ, Huang PP, Zhao H, et al. Billion-scale commodity embedding for E-commerce recommendation in Alibaba. Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. London: ACM, 2018. 839–848.
[22]
Wu S, Tang YY, Zhu YQ, et al. Session-based recommendation with graph neural networks. arXiv: 1811.00855, 2019.
[23]
Wang RX, Fu B, Fu G, et al. Deep & cross network for ad click predictions. Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Halifax: ACM, 2017. 12.
[24]
Covington P, Adams J, Sargin E. Deep neural networks for YouTube recommendations. Proceedings of the 10th ACM Conference on Recommender Systems. Boston: ACM, 2016. 191–198.
[25]
Cheng HT, Koc L, Harmsen J, et al. Wide & deep learning for recommender systems. Proceedings of the 1st Workshop on Deep Learning for Recommender Systems. Boston: ACM, 2016. 7–10.
[26]
Guo HF, Tang RM, Ye YM, et al. DeepFM: A factorization-machine based neural network for CTR prediction. arXiv: 1703.04247, 2017.
[27]
Zhang JL, Huang TW, Zhang ZQ. FAT-DeepFFM: Field attentive deep field-aware factorization machine. arXiv: 1905.06336, 2019.
[28]
He XN, Chua TS. Neural factorization machines for sparse predictive analytics. Proceedings of the 40th International ACM SIGIR Conference on Research and Development in Information Retrieval. Shinjuku: ACM, 2017. 355–364.
[29]
He XN, Liao LZ, Zhang HW, et al. Neural collaborative filtering. Proceedings of the 26th International Conference on World Wide Web. Perth: International World Wide Web Conferences Steering Committee, Republic and Canton of Geneva, Switzerland, 2017. 173–182
[30]
Wang ZQ, She QY, Zhang PT, et al. Correct normalization matters: Understanding the effect of normalization on deep neural network models for click-through rate prediction. arXiv: 2006.12753, 2020.
[31]
Huang TW, She QQ, Wang ZQ, et al. GateNet: Gating-enhanced deep network for click-through rate prediction. arXiv: 2007.03519, 2020.
[32]
Wang JY, Chen YB, Chakraborty R, et al. Orthogonal convolutional neural networks. Proceedings of 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Seattle: IEEE, 2020. 11502–11512.
[33]
Zhou J, Albatal R, Gurrin C. Applying visual user interest profiles for recommendation and personalisation. Proceedings of the 22nd International Conference on Multimedia Modeling. Miami: Springer International Publishing, 2016. 361–366.
[34]
Tang JX, Wang K. Personalized top-N sequential recommendation via convolutional sequence embedding. Proceedings of 11th ACM International Conference on Web Search and Data Mining. Marina: ACM, 2018. 565–573.
[35]
Shen XX, Yi BL, Zhang ZL, et al. Automatic recommendation technology for learning resources with convolutional neural network. Proceedings of 2016 International Symposium on Educational Technology (ISET). Beijing: IEEE, 2016. 30–34.
[36]
Gong YY, Zhang Q. Hashtag recommendation using attention-based convolutional neural network. Proceedings of the 25th International Joint Conference on Artificial Intelligence. New York: AAAI Press, 2016. 2782–2788.
[37]
Zheng L, Noroozi V, Yu PS. Joint deep modeling of users and items using reviews for recommendation. Proceedings of the 10th ACM International Conference on Web Search and Data Mining. Cambridge: ACM, 2017. 425–434.
[38]
Liu B, Tang RM, Chen YZ, et al. Feature generation by convolutional neural network for click-through rate prediction. Proceedings of the World Wide Web Conference. San Francisco: ACM, 2019. 1119–1129.
[39]
Liu H, Lu J, Yang H, et al. Category-specific CNN for visual-aware CTR prediction at JD. com. Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. ACM, 2020. 2686–2696.
[40]
Hidasi B, Karatzoglou A, Baltrunas L, et al. Session-based recommendations with recurrent neural networks. arXiv: 1511.06939, 2016.
[41]
Hidasi B, Karatzoglou A. Recurrent neural networks with top-k gains for session-based recommendations. Proceedings of the 27th ACM International Conference on Information and Knowledge Management. Torino: ACM, 2018. 843–852.
[42]
Devooght R, Bersini H. Collaborative filtering with recurrent neural networks. arXiv: 1608.07400, 2017.
[43]
Donkers T, Loepp B, Ziegler J. Sequential user-based recurrent neural network recommendations. Proceedings of the 11th ACM Conference on Recommender Systems. Como: ACM, 2017. 152–160.
[44]
Li Z, Zhao HK, Liu Q, et al. Learning from history and present: Next-item recommendation via discriminatively exploiting user behaviors. Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. London: ACM, 2018. 1734–1743.
[45]
Feng YF, Lv FY, Shen WC, et al. Deep session interest network for click-through rate prediction. Proceedings of the 28h International Joint Conference on Artificial Intelligence. Macao: IJCAI.org, 2019. 2301–2307.
[46]
Zhou GR, Zhu XQ, Song CR, et al. Deep interest network for click-through rate prediction. Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. London: ACM, 2018. 1059–1068.
[47]
Zhou GR, Mou N, Fan Y, et al. Deep interest evolution network for click-through rate prediction. arXiv: 1809.03672, 2018.
[48]
Zhou C, Bai JZ, Song JS, et al. ATRank: An attention-based user behavior modeling framework for recommendation. arXiv: 1711.06632, 2017.
[49]
Xiao J, Ye H, He XN, et al. Attentional factorization machines: Learning the weight of feature interactions via attention networks. Proceedings of the 26th International Joint Conference on Artificial Intelligence. Melbourne, 2017. 3119–3125.
[50]
Song WP, Shi CC, Xiao ZP, et al. AutoInt: Automatic feature interaction learning via self-attentive neural networks. Proceedings of the 28th ACM International Conference on Information and Knowledge Management. Beijing: ACM, 2019. 1161–1170.
[51]
Sun F, Liu J, Wu J, et al. BERT4Rec: Sequential recommendation with bidirectional encoder representations from transformer. Proceedings of the 28th ACM International Conference on Information and Knowledge Management. Beijing: ACM, 2019. 1441–1450.
[52]
Ouyang WT, Zhang XW, Li L, et al. Deep spatio-temporal neural networks for click-through rate prediction. Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. Anchorage: ACM, 2019. 2078–2086.
[53]
Chen QW, Zhao H, Li W, et al. Behavior sequence transformer for e-commerce recommendation in Alibaba. Proceedings of the 1st International Workshop on Deep Learning Practice for High-dimensional Sparse Data. Anchorage: ACM, 2019. 12.
[54]
Wang X, He XN, Feng FL, et al. TEM: Tree-enhanced embedding model for explainable recommendation. Proceedings of the 2018 World Wide Web Conference. Lyon, 2018. 1543–1552.
[55]
Zhu H, Li X, Zhang PY, et al. Learning tree-based deep model for recommender systems. Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. London: ACM, 2018. 1079–1088.
[56]
Su YX, Zhang R, Erfani S, et al. Detecting beneficial feature interactions for recommender systems. arXiv: 2008.00404, 2021.
[57]
Zhang K, Qian H, Cui Q, et al. Multi-interactive attention network for fine-grained feature learning in CTR prediction. Proceedings of the 14th ACM International Conference on Web Search and Data Mining. Virtual Event: ACM, 2021. 984–992.
[58]
Deng W, Pan JW, Zhou T, et al. DeepLight: Deep lightweight feature interactions for accelerating CTR predictions in Ad serving. Proceedings of the 14th ACM International Conference on Web Search and Data Mining. Virtual Event: ACM, 2021. 922–930.
[59]
Murugan P, Durairaj S. Regularization and optimization strategies in deep convolutional neural network. arXiv: 1712.04711, 2017.
[60]
Srivastava N, Hinton G, Krizhevsky A, et al. Dropout: A simple way to prevent neural networks from overfitting. The Journal of Machine Learning Research, 2014, 15(1): 1929-1958.