发布时间:2025-4-26 分类: 行业资讯
电子商务环境中的个性化推荐主要包括模块的三个维度,用户的候选召回,候选产品的排名和在线重新排名。匹配和排名是推荐过程中的两个关键步骤。
一、Match
匹配是一种有效且丰富的回忆,可根据用户行为和属性信息从一组完整大小的项目(包括提要和视频等)中触发尽可能多的正确结果,并将结果返回给Rank。
推荐不同的搜索,在没有明确的Query访问权限的情况下,用户的Match调用尤为重要,希望相关信息尽可能丰富。
因此,Match面临着整个商品库的集合,有必要保留尽可能多的相关结果,消除较弱的相关结果,并减少后续链接的压力。
因此,需要综合利用诸如用户信息(年龄,表现,购买力等),类别信息,商店信息,文本信息等各种信息。从而确保高召回率并确保高精度。匹配的质量对整体结果产生重要影响。
匹配召回策略包括两个主要类别:基于内容的召回和基于协作过滤的召回。
前者主要基于用户的肖像信息和产品的内容信息来执行匹配的召回。该方法具有较高的召回率但精度较低,更适合冷启动语义环境。
后者主要基于用户与商品之间的行为矩阵,用户与候选产品之间的相关性通过一系列策略获得;这种方法具有较高的精度,但存在一定程度的冷启动问题。协同过滤是当前推荐依赖的基础策略。
二、Rank
排名是完成,通过准确的预测模型在比赛阶段准确评分商品,并根据评分结果排序和截断,并确定最终呈现给用户的结果的顺序。
Rank模型的两个主要元素是特征提取和评分模型学习训练。
特征提取中的第一步也是最重要的一步是清理日志。可以通过日志掩埋点过滤曝光日志,并结合更准确的搜索,单击和收集用户行为日志,聚合User_id和Item_id维度,最后将两个日志Join作为用户要素样本一起构建。
特征提取除了基本的属性功能,如user_id,item_id,用户年龄和性别等,还有每小时或分钟回流的准实时反馈功能,还包括用户和项目的双向交叉功能,例如不同类别的用户。在优先程度下,项目是在不同性别的购买力下的ctr。
除了用户的实时功能外,离线模型的日志和功能访问,预处理和离线功能统计信息还可以通过实时功能进行补充。在此,处理长期兴趣和各种平滑逻辑的统计特征的准备。 ,提供数据方面的保护。
评分模型主要分为CTR和CVR估计模型。在显示商品之前,结合用户的历史行为和商品&场景信息,估计用户是否会在产品显示后点击,或点击后是否会购买,所以在Rank时有不同的CTR和CVR倾向。
目前,成熟的排名模型是多维得分融合排序,并获得多维度的估计得分,包括CTR估计,CVR估计,笔单价和商品毛利,并根据业务指标进行调整,以计算最终的RankScore 。
三、End
推荐算法是Match和Rank的链接。当用户添加模型并回忆较少的内容时,排名排序没有太多的游戏空间。当用户的行为丰富且更容易召回时,排名排序可能更有效。
作者:链接,微信公众号:从0到1(aboutlink)。美团审核产品经理,负责亿级用户平台,专注于O2O,用户产品设计,数据分析等领域。
本文最初由@Link发布。未经许可,禁止复制。
该地图来自unsplash,基于CC0协议