提醒:因为软件开发行业无明确禁止法规, 该企业仅提供软件开发外包定制服务,项目需取得国家许可,严禁非法用途。 违法举报

推荐策略产品经理必读系列—第二讲推荐系统的架构

2024-12-27 07:07 113.78.238.160 3次
发布企业
东莞市数云网络科技有限公司商铺
认证
资质核验:
已通过营业执照认证
入驻顺企:
4
主体名称:
东莞市数云网络科技有限公司
组织机构代码:
91441900MACKCG2W01
报价
请来电询价
所在地
东莞市
联系电话
18665158422
dapp开发
18665158422
商业模式架构导师
杨小花  请说明来自顺企网,优惠更多
请卖家联系我
yqm106106

产品详细介绍

编辑导语:推荐系统是如何做到向用户推荐他感兴趣的物料的,这个取决于我们的推荐系统架构。作者对推荐系统的架构进行了详细的阐析,了7大搭建架构环节,希望对你有所帮助。

上一篇为大家介绍了作为一个推荐策略产品必须了解的行业里发生的大事以及行业整体未来的趋势,本篇就为大家详细介绍推荐系统的架构,推荐系统是如何把我们感兴趣的物料推荐到我们面前的。

一、整体架构

将推荐系统架构里面主要的部分整体如上图,用户打开APP看到为自己推荐的物料,正常都是需要经过5-6个环节。常见的流程从建立物料索引,再到召回、粗排、精排、重排到过滤层,Zui终展示在了APP前段,为用户推荐了感兴趣的物料。

二、物料索引

APP里有哪些物料是可以推荐给用户,会有一个总的物料池,物料池本身存储在数据库中。为了查询时更加方便快捷,我们需要提前构建好物料索引。尤其是很多召回路是基于一些标签进行召回的,更加需要提前构建好倒排索引。物料的清洗和索引的构建是推荐系统的第一步基础工作。

三、召回层

构建完物料索引后,推荐系统是如何挑选出用户感兴趣的物料了。推荐算法发展到现在,我们可以称之为4.0时代。4.0时代的推荐算法都是以预估用户的点击率(CTR)为核心,基于用户对于每个物料的预估点击率(Predicted-CTR)来进行排序,按照Predicted-CTR值进行倒排。以上介绍的是Zui理想的方式,实际却无法执行也没必要。

原因一:无法实现

物料库的量级太大,比如像淘宝这种平台物料几十亿商品,如果用户的每次请求都去预估几十亿商品的Predicted-CTR,需要大量的机器资源,时延会非常高。大家打开淘宝首页可能需要几十个小时,且不一定能加载出来。

原因二:没有必要

几十亿的商品,有很多商品是非常冷门商品,99%以上的商品和用户毫无关联,完全没有必要如此精细化去预估用户对于几十亿商品的兴趣度。

推荐系统演变成先通过召回层初步筛选出用户可能感兴趣的一些物料,比如800个。再进入粗排和精排,其他几十亿的物料直接在召回阶段就被过滤了。这样的架构设计大大降低了推荐系统的计算压力,也不影响推荐系统的整体效果。

而召回阶段,市面上Zui先进的模式就是针对不同的用户进行分层,不同层级的用户使用的召回路数不一样,核心都是多路召回,每一路召回返回的物料个数以及对应的权重都是和用户本身的分层有很大关系,实现非常精细化的用户和召回路数的管理。

常见的召回方法有基于热销商品的召回、基于历史高点击商品的召回、用户历史看过商品的召回,还有一些常见的协同过滤算法比如Item-CF、User-CF。关于召回阶段常用的策略和算法后面会有专门的文章进行讲解。

四、粗排层

大家可以看到召回阶段会有非常多的召回策略,那我们如何将这些各路召回的商品汇总在一起进行一个统一排序了。比如热销路的召回,召回了Top100的商品;历史高点击的召回,同样召回Top 100的商品。这两路召回的商品可能还会有重叠的。

在召回层里,每一路的召回都需要将物料的分数进行归一化。比如说热销路的召回,如何召回Top100的商品,需要计算每一个商品的热销分数,取Top100的商品。历史高点击的召回路也是一样,并且每一路的分数都需要归到【0,1】之间,这样各个路之间才能比较。

不同场景下每一路召回的重要性也完全不一样,可以再设置一个对应的系数。比如热销路召回为0.5,历史高点击路召回为0.7,假设商品A在热销路召回分数为0.8,历史高点击路召回分数为0.3,那么Zui终这个商品的总召回分数为:0.5X 0.8 + 0.7 X 0.3 =0.61。粗排层就需要将每一个召回的商品进行上述计算方式进行处理后,汇总得到一个总的List,选择TopK的商品给到精排层。

五、精排层

精排层的核心任务就是预估用户对于召回层返回的TopK商品的Predicted-CTR。召回和粗排只是选择出了用户可能感兴趣的物料,每一个物料具体的预估CTR是多少并不知道。

精排层就需要基于用户历史点击过的物料作为正样本,曝光未点击的物料作为负样本,构建CTR预估模型,预估用户对于每一个物料的Predicted-CTR。在精排层核心要做的几件事情:数据清洗构建正负样本,选择合适的排序算法,构建特征工程、模型训练与效果评估。

Zui终基于精排模型预估出的CTR对于召回的物料再重新进行一次排序。精排模型的预估是整个推荐系统中耗时Zui多的,因为特征十分复杂,特征维度很多。如果针对几十亿物料全部进行CTR预估,系统直接崩溃,这也是需要先进行召回的原因。

六、重排层

那是不是精排过的物料,直接按照精排后的顺序直接展示在了APP前端了。很多时候推荐系统仍然有一些其他业务规则进行干预。比如在电商推荐系统里面,就会有以下的一些策略:

1. 类目打散

对于给用户推荐的商品如果类目集中度过高,会进行一定程度的打散。比如精排模型给用户返回的前10个商品全部都是鞋子,可能该用户偏好鞋子,但前10个商品全部是鞋子此种集中度还是过高了,重排层就会将后面其他类目的商品插入到这10个商品中。具体按照类目打散的规则每家不一样,核心是基于业务场景。打散不是目的,目的是为了提升推荐系统的点击率。

2. 不同类型物料混合

比如淘宝,淘宝推荐场景里面有的内容类型有:店铺、活动、直播、商品、视频等等。那这些不同类型内容之间如何进行混合。能否可以出现连续4个全部都是直播,或者4个全部都是视频。为了降低用户的审美疲劳,很多时候针对不同类型的内容推荐系统也会进行重新打散。但同样打散不是目的,目的是为了提升推荐系统的点击率。

3. 全局Zui优

重排层还有一个核心的逻辑就是实现全局Zui优。精排层是预估用户对于单个物料的CTR,这是一种局部Zui优的思想。用户在浏览时正常都会一次性浏览多个,怎么样的物料组合可以实现全局Zui优而不是局部Zui优。同样4个坑位,有可能精排排序在1,3,5,7的四个物料组合比精排排序在1,2,3,4的四个物料组合整体CTR更高。

重排层是推荐系统Zui后一道策略和模型的调整了。

七、过滤层

重排层调整完的物料顺序还会再进行一些业务规则和策略的干预,比如电商领域会进行以下的过滤:

1. 未上架过滤

当前已经上架的商品不展示在APP前端。

2. 缺货过滤

当前已经缺货的商品不展示在APP前端。

包括还有同图过滤等等策略。过滤层很多时候我们会做在了粗排和精排之间,确保进入到精排的物料后续都是能够直接在APP前端展示的,这样后续的精排和重排层的价值才更高。原本重排挑选出的Zui优组合,结果全部在过滤层被过滤了,那么整体推荐系统的效果就会大打折扣。

八、APP前端

经过过滤层的物料顺序是不会再发生变化,但还是有Zui后一步工作要做,而很多推荐系统的文章都没有介绍。就是内容样式和创意。比如电商平台里面同样都是店铺的内容,到底应该展示哪一种样式。大家打开淘宝首页经常会觉得花里胡哨,就是因为内容的样式太多了。

APP前端选择Zui合适的一种内容样式进行展示,具体关于内容样式和创意的选择后续也会有专门文章进行介绍。

经过7个大的环节,推荐系统也就在APP推荐场景为用户推荐了他可能感兴趣的物料。以上就是关于推荐系统架构的一个完整介绍。下一期为大家详细介绍推荐系统的召回策略,欢迎大家持续关注。

本文由 @King James 原创发布于人人都是产品经理。未经许可,禁止转载。


关于东莞市数云网络科技有限公司商铺首页 | 更多产品 | 联系方式 | 黄页介绍
成立日期2019年06月19日
法定代表人18665158422
注册资本18665158422
主营产品数字藏品系统开发,元宇宙系统开发,嗨购模式,广告电商系统,泰山众筹模式,分享购cps系统、定制开发、请联系18002820787模式快速开发.APP软件系统公众号小程序开发APP软件系统公众号小程序开发APP软件系统公众号小程序开发APP软件系统公众号小程序开发APP软件系统公众号小程序开发公司以小程序开发、微商城开发、网站建设、APP开发为核心业务,专注于界面设计、技术研发、品牌营销,为客户提供一站式互联网解决方案,提供优质的系统支持服务,努力为客户创造大的价值,助力中小企业进行互联网+转型与升级。 专注于公众号商城开发,苹果+安卓app,H5网页开发,小程序开发,专页定制开发商业模式系统软件, 1.主营分销系统开发: 二级分销系统,分红模式系统(团队分红系统,股东分红系统,级差返利系统,区域分红系统),微商云仓系统,微商代理授权系统,复购模式系统,拼不中返利拼团系统,商家O2O系统,一条线排队返现系统,公排系统,直销系统,积分商城系统,签到+免费领面膜系统,扫码分销系统。 热门模式系统开发:即拼商城系统、光明新零售系统、拼团拼购系统、完美天使美牙系统,言蕾回春面具面膜系统,创客新零售系统。
经营范围花葵直播模式快速开发.APP软件系统公众号小程序开发APP软件系统公众号小程序开发APP软件系统公众号小程序开发APP软件系统公众号小程序开发APP软件系统公众号小程序开发公司以小程序开发、微商城开发、网站建设、APP开发为核心业务,专注于界面设计、技术研发、品牌营销,为客户提供一站式互联网解决方案,提供优质的系统支持服务,努力为客户创造大的价值,助力中小企业进行互联网+转型与升级。 专注于公众号商城开发,苹果+安卓app,H5网页,小程序开发,专页定制开发商业模式系统软件, 1.主营分销系统开发: 二级分销系统,分红模式系统(团队分红系统,股东分红系统,级差返利系统,区域分红系统),微商云仓系统,微商代理授权系统,复购模式系统,拼不中返利拼团系统,商家O2O系统,一条线排队返现系统,公排系统,直销系统,积分商城系统,签到+免费领面膜系统,扫码分销系统。 2. 热门模式系统开发:即拼商城系统、光明新零售系统、拼团拼购系统、完美天使美牙系统,言蕾回春面具面膜系统,创客新零售系统。 系统开发请联系:(电微)
公司简介如何上线NFT电商平台:1.首先要有一套NFT电商系统,它可以为你的每一个商品铸成唯一的NFT序列号(你可以把它理解为唯一的“身份证”);2.假设现在你手上有一个古董/名画,你可以用这个NFT电商系统给他生成一个专属NFT,然后就可以发布到平台交易了;3.用户在平台(手机端)看到这个NFT古董/名画,有两个选择,一是直接购买,可以提货,平台寄送,放家里收藏;二是买了之后直接在这个平台上挂售出去,如 ...
公司新闻
顺企网 | 公司 | 黄页 | 产品 | 采购 | 资讯 | 免费注册 轻松建站
免责声明:本站信息由东莞市数云网络科技有限公司自行发布,交易请核实资质,谨防诈骗,如有侵权请联系我们   法律声明  联系顺企网
提醒:因为软件开发行业无明确禁止法规, 该企业仅提供软件开发外包定制服务,项目需取得国家许可,严禁非法用途。 违法举报
© 11467.com 顺企网 版权所有
ICP备案: 粤B2-20160116 / 粤ICP备12079258号 / 粤公网安备 44030702000007号 / 互联网药品信息许可证:(粤)—经营性—2023—0112