Code前端首页关于Code前端联系我们

产品搜索与排序:一般电商搜索方式概述

terry 2年前 (2023-09-24) 阅读数 63 #后端开发

在网上购物时,我们可以通过搜索功能直接找到我们需要的产品。这个过程非常快速和方便。为了更快地满足我们的需求,搜索完成后,系统会根据其内部逻辑来搜索结果。下面简要总结一下电子商务研究的一般机制。 ?记住相关产品,并利用算法根据用户的实际搜索意图来组织产品,最终满足用户的需求并实现业务转化。 商品搜索与排序:电商搜索的一般机制总结

2 特殊应用商品搜索与排序:电商搜索的一般机制总结

1。 用户提出问题并开始搜索。
2. 知识问题
2.1. 前置问题
由于用户内容可能不标准化,因此需要进行预处理。预处理的方法有多种,如下所示。其中,复杂的词典、错词列表或纠错模型可能因公司而异,因此需要专门维护。
预处理包括纠错、单词练习、拼音到中文转换以及从问题中删除停用词等任务。目前使用最广泛的中文语言服务器是HanLP和Elasticsearch的IK语言服务器。
假设用户输入“康师傅红烧方便面*%”。
分词:首先将全题拆分为“康师傅”、“红烧”、“方便面”、“”、“%”。
拼音转汉字:将拼音“kangshifu”转换为“康师傅”。
删除停用词:删除无意义的停用词,例如“”和“%”。 商品搜索与排序:电商搜索的一般机制总结

2.2。 具体跳转
在电商中,有时候关键词设置不会跳转到商品列表页,而是直接跳转到店铺页或者商品页的动作。例如,输入关键字“阿迪达斯”可以直接进入阿迪达斯商店页面或阿迪达斯活动页面。
为了完成这个任务,跳转规则图库需要保存在后台。当用户的搜索关键词与规则库中的关键词匹配时,返回指定的跳转路径,直接跳转至首页。一般来说,这些跳转规则是有时间限制的。
2.3。 问题拆分
查询措辞是将较长关键字解析为较短关键字的过程。它将问题分成很多词(词),例如“淘宝手机”就分为两个:“手机”和“淘宝”。一般来说,词分布是根据产品的性质来划分的。产品属性包括产品名称、品牌、类别、功能、制造商、详细信息等。在开发过程中,选择支持通用语言分发的语言训练系统是一个好主意。最好找到相关行业的单词分发系统。或者,也可以基于通用的文字处理库进行扩展,以满足业务需求。
2.4。 实体识别(类别预测)
根据用户输入的搜索词,预测用户想要搜索的元素,例如产品、内容或表达等。这项技术非常重要,可以提高研究的准确性。
分词后,我们会得到一个或多个关键词或关键词,每个关键词可以对应一个或多个元素。例如,搜索词“珠江新城咖啡馆”,分词后得到“珠江”、“珠江新城”、“咖啡馆”、“咖啡馆”等词。有些词可能对应于特定的类别。例如,“珠江新城”可以匹配商圈或地铁站的商业术语,“咖啡馆”可以匹配食品类别术语,“咖啡店”可以对应餐厅类型的词汇。
例如,如果我们得到“苹果手机”这个词,对于“苹果”这个词,我们可以在产品属性或类别中匹配品牌。不同的特征的重要性是不同的。现阶段部门的认可可以为下一题的改写提供基础。
总的来说,我们需要构建领域内的实体体系,这也是领域内经常关注的特点。下图是阿里云Opensearch投入电商行业的词典类型示例。 商品搜索与排序:电商搜索的一般机制总结

对于2.21中的“康师傅”、“红烧”、“方便面”,我们可以进行公司的审批,最终的产品可以是【品牌:康师傅;口味: 油炸; SPU及类别:方便面】。多个单词可以匹配多个项目。 SPU和CATEGORY都可以,比如这里的“方便面”。 商品搜索与排序:电商搜索的一般机制总结

这样的实体识别可以预测用户的搜索意图,并在对下面的搜索结果进行分类时提高相关实体的排名。例如,在微信搜索中,如果搜索“高其强表情包”,微信会优先搜索表情包结果。 商品搜索与排序:电商搜索的一般机制总结

通过分析用户输入的问题和点击行为数据,我们可以将类别下的商品信息与问题关联起来,并利用这些数据来训练模型,确定请求与内容之间的关系类别。如果问题与某个类别更相关,则该类别将被赋予更高的权重。
在编写过程中,如果原始查询没有类别预测结果,我们可以根据一些规则来预测类别(逐渐去除与类别意图无关或没有值的词)。这提高了问题的准确性。
2.5。 查询重写
1)同义词重写
很多名词都有完全相同的单词,所以在回忆问题时,我们需要使用同义词作为记忆手段。例如“樱桃番茄”和“樱桃番茄”、“香菜”和“香菜”。这提高了支行的知名度。
2)名词复习
很多单词不一样,不包括在内,但它们是相似的,可以通过某种方式替换。例如“矿泉水”和“纯净水”、“纯牛奶”和“舒化奶”等。之所以设置类似的数据,是因为在某些情况下,当用户搜索某个公司时,如果该公司不存在。为企业进行产品匹配,没有反馈的直接曝光可能会降低您的销售额。但如果也显示同义词,用户通常仍然会下订单,因为两者之间没有太大区别。
当然,有些应用程序会执行“为您推荐”中的这部分功能。不管具体表达在哪里,其背后的逻辑都是一样的。
3)复习介词的书写
介词与同义词不同。在许多情况下,他们已经存在关系。例如“苹果”和“红富士”,“早餐”和“包子、馒头、豆浆”。当用户搜索“富士红”时,如果没有该公司,则可能会通过关键字显示其他类型的苹果。当用户搜索“早餐食品”时,如果没有“早餐食品”类别或名为“早餐食品”的产品,我们只能使用此类术语进行链接。编写 Promise 可以帮助我们了解用户的搜索意图。
为什么我们小心地将词汇分解为同义词、同义词、同义词等。是因为我们需要在不同的情况下使用不同的词组。如果你把它们全部混合起来,你会感到困惑。它无法被摧毁。上述构建和收集数据的方法一方面需要通过人工经验来帮助其,另一方面通过机器挖掘历史用户搜索记录和隐藏数据来创建与人工审核相关的字典。
4)调整公司价值
取决于公司的需要。企业价值调整常用于成熟的电商APP。例如,用户搜索“类似王一博的限量版白汗”,则需要共享提醒条件。如果用【王一博同款白卫衣限量版】的话,去索引去记,可能结果很少。
所以我们需要建立记忆标准,重写问题,选择更重要的标准来记住,并忽略其他标准。我们可以将Query重写为[王一博和白色和运动衫],这样实体之间就有优先级。某些实体的特征优于其他实体的特征。
以上四类写作题,需要写相同的单词。一般来说,输入同义词和输入单词用于记忆结果很少的搜索字段。我们希望显示尽可能多的搜索结果。充分利用一切曝光机会。调整公司权重有时会产生过多的记忆结果,需要加以控制;有时内存结果太小,需要扩展,具体取决于业务的需求。 商品搜索与排序:电商搜索的一般机制总结

3。 Recall
使用服务去存储库进行调用并构建内存条件。

在召回过程中,常常需要在“召回率”和“准确率”之间进行权衡。
如果返回的数据过多,可能会包含无效结果。如果调用的数据太小,则可能无法调用目标结果。为了优化搜索结果,我们可以通过添加过滤条件和实时识别技术,为不同部门提供不同的召回率。
以高其强为例,搜索“高其强”名字的人数最多,因此“名字”的价值最高。第二热门搜索结果是“旧场街”,可以获取公司“家庭地址”作为中等值。搜索高其强身高的人肯定很少,而他的体重则是最低的。因此,当用户搜索175时,无需记住高其强的数据。 商品搜索与排序:电商搜索的一般机制总结

适用于多个角色的情况,例如【品牌:康师傅;口味: 油炸; SPU&CATEGORY:立即补丁],我们通常通过“与”关系来记住分支。但在上面的例子中,“速溶锅”有两个特性,所以需要将这两个特性用作内存。同时,我们还可以添加同义词来创建新的回忆术语。例如“instant poty”这个词也属于SPU公司所有,所以可以开发其他内存需求【品牌:康师傅;口味: 油炸; SPU:方便面】。
在新食品电商中,设置提醒很简单。但在全电商中,比如用户搜索【王一博的汗印】,提醒条件就需要共享。如果直接用【王一博同款白汗限量版】来进行提醒,也许会得到一些效果。因此,我们需要重构召回标准,重写问题,选择重要的召回标准,忽略其他标准。例如,我们可以将请求改写为[王一博和白色和运动衫],这样分支之间就有了优先级,某些分支的特征与其他分支的特征不同。
最后,通过提醒过程,得到搜索结果。

4。 排序
在排序过程中,选中的产品将按照产品的重量进行排序。产品研究和重量设计是大型电商平台的商业秘密,具体逻辑往往不公开。但一般来说可能存在以下几个模块,各公司可以根据自己的需求进行调整和改进设计。
4.1。 权重
4.1.1 权重概念
权重表示参数在整个评价体系中的重要性。权重越高,标志越重要。
例如,考虑一次入学考试,有三门科目:语文(100分)、数学(100分)和英语(100分)。总分是语文30%、数学40%、英语30%相乘得出。得分最高的人将首先被选中。
这包括每个受试者体重的百分比。如果数学达到40%,说明学校更加重视数学成绩。
赋权方法有多种,如加权法、平均法、AHP层次法、优先图法等。下面以简单的加权方法作为输入示例。
4.1.2 加权方法
还是上面的例子,如果有考生成绩如下:语文(85)、数学(90)、英语(80),则流程他的繁重算计。 :85*30% + 90*40% + 80*30% = 85.5 - 简单的一步【分数*比例】然后求和。
在搜索时,产品排名的最终权重是多种因素综合作用的结果。每个属性的值越高,它就越重要。需要注意的是,在权重模型中,并不是产品的所有特性都会参与权重计算。只有影响搜索习惯和销量的因素才会被纳入计算中。
数值不必局限于百分比系统。重量的多少可以根据产品特性和产品数量进行调整。这样可以防止最终的重量值过于集中。
4.2。 影响最后一个数字的数字
4.2.1。 文字链接
文字链接是指产品文字信息(包括产品标题、产品名称、类别名称、品牌、产品标签、作者、图书产品的出版商等)与搜索的关联或匹配关键词。不同的信息对于文本来说具有不同的重要性。文章的重要性大致可分为高重要性、中重要性和低重要性,相应的权重逐渐递减。在分类机制中,产品标题和关键词通常具有最高的价值和最高的价值。
在产品文章信息中,选择关键词时,应选择行业内搜索指数和交换价值指数较高的关键词。关键词的顺序不会影响搜索值。但你也应该检查产品和这些关键词之间的关系,否则产品的价值也会降低。
4.2.2。 品类平衡
在品类预测中提到,不同关键词与品类之间的相关性是不同的,可以为品类相关性赋予适当的权重。通过类别预测,可以在关键词和一个或多个类别之间建立联系(属性得分)。这些类别内的产品将在类别关系方面被分配特定的权重(权重)。等于按权重计算的属性数量)。如果有多个关键字,则附上相应的类别值。
4.2.3。 定价模型
在评分机制中,每个关键词在价格价值方面都有不同的评分。您可以根据预定义表的价格找到产品对应的价格数量。例如,男士牛仔裤,消费者的总成本在146元至224元之间。你可以把产品的价格放到这个字段中,然后根据价格在分类机制中的权重,就可以得到产品属性的权重。
4.2.4。 产品全热度
除了基本的产品信息外,产品全热度分数还表明该产品是否受欢迎,需要首先展示给用户。 商品搜索与排序:电商搜索的一般机制总结

4.2.5。 用户搜索反馈
客户搜索关键字后点击或购买产品的行为,将被视为对该关键字和产品在数据库中的点击或购买。客户搜索结果系统。客户反馈数据反映了客户对搜索结果的满意度以及对产品的满意度。还有生产率,当然是越低越好。 商品搜索与排序:电商搜索的一般机制总结

4.2.6。 在平台上评分,保存静态评分
平台上的产品会有售前、售中、售后问题。这些问题能否得到友好解决也会影响产品的评级。
比如京东风向标:

店铺静态评分:
包括店铺是否被处罚,是否被举报、投诉,店铺装修的基本情况。 , ETC。
将所有权重相加即可得到搜索结果的总权重。计算每个结果的总权重,最终将搜索结果列表返回给用户。
下图是一个简单的产品重量模型示例:商品搜索与排序:电商搜索的一般机制总结

4.2.7。 品类影响
例如,小米品牌下有很多不同品类的产品。如果有手机和电视两个品类,每款手机的评分都很高,那么手机品类下的品牌数量和权重就会设置得更高;电视刚刚进入市场,接受度低于老牌厂商。相对较低,所以电视品类的数量和品牌强度应该较低。
另外,有些品类具有特殊性,需要参与权重计算,例如图书产品的出版商、作者等。不同品类的具体特点也不同。因此,在维护权重模型的基本结构时,应在类别层面进行维护,以实现具体的权重设计。
4.2.8。 手动干预
设置权重配置后,通常会通过代码逻辑计算内部得到权重值。但如果平台需要推广新产品,由于缺乏新产品的销售数据,排名会较低。因此,需要开发一个维护门户来增加每个产品的价值,并推广新产品的数量,以达到推广目标。
4.2.9。 外部因素的影响
由于某些产品的具体特性,其价值可能会受到外部因素的影响。例如,衣服和鞋子的材质特​​性会受到季节的影响。对于登山鞋来说,如果材质是羊毛和涤纶,在夏季搜索关键词“登山鞋”时,涤纶产品应该较高,而棉绒制成的产品应该较低。因此,在计算时需要考虑这些依赖性。
4.2.10。 千人千面
事实上,只要客户在淘宝上购买或浏览,平台就会对用户进行标记,例如年龄、客户价格、他的选择、关注点等。根据用户标签的不同,每个用户进入APP时显示的结果也不同。假设两个男孩以前从未购买过女性产品,但他们是第一次购买女性产品。如果他们搜索与“女装”相同的关键字,他们会找到其他产品的列表。该平台将根据您过去的购买情况为它们命名。例如,如果用户有“年轻、高端消费者、喜欢名牌”等标签,那么向该用户展示的产品就是服装相关产品。即:根据用户特征,将可能畅销的产品优先推荐给对应的客户,提高购买转化率,促进用户购买下单。这才是千人万面的真正目标。
上述用户特征通常被称为“用户特征”。我们一般都会维护一个用户特征的数据库,这是一个几千人的数据库。在研究和推荐过程中经常需要这些用户数据。
自定义分类是为了满足不同客户对同一搜索词的需求而设计的分类服务。如今的自定义分类逻辑往往是根据客户的浏览、加购、购买、搜索、咨询等价值进行计算和分类。对产品本身的看法、看法等。
个性化搜索排名的应用涉及很多因素,包括客户导航数据、购买数据,以及性别模式、购买权力模型等数据。这样可以使分类结果多样化,满足不同客户的不同研究需求。另外,为了改善搜索体验,搜索结果中的缺失结果将会减少,以减少对搜索体验的影响。
不断完善个性化搜索排名,不仅提高用户参与度,还提高购销匹配的精准度,改善客户搜索体验,为卖家带来更精准的流量。
二、千人千面的主要原因是什么?有很多因素影响着成千上万的人。李老师在这里为您分解几个关键领域:客户关系、多品牌、产品品牌和基本的产品/营销素养。顾客互动是指顾客查看、收藏、购买、购买的商品,顾客收藏、购买的店铺以及顾客关心的店铺。多个品牌指的是产品的关键人口统计数据,包括性别、年龄、消费能力、城市、职业、婚姻和爱情阶段,以及是否拥有房子。产品品牌是指产品的类别和特征。商品/店铺的基本品质,体现了店铺及商品是否违规下分、活跃评分、好评率、退货率、争议率等。成千上万的人、成千上万的面孔的表演?
1)客户关系:搜索结果页面会优先考虑与用户有客户关系的产品。这包括用户最近查看、收集和购买的产品。当然,搜索显示的标题是包含搜索关键词的标题。
2)品牌产品和关键词权重:如果没有客户关系的产品,搜索结果页会直接展示品牌产品和关键词权重高的产品。
3)事件页面:事件页面也是按照这个逻辑显示的。您点击查看、收藏、购买、关注的产品将首先显示。
4)推荐页面:在推荐页面,千人千面会优先展示多个品牌的产品。比如,对A产品感兴趣的人,推荐页面就会展示与A产品接近的产品,这就是千人一面的力量。另外,无论是搜索结果页、推荐页还是操作页,如果产品存在违规、店内动态评分低、退货率高,展示产品的能力就会下降。

版权声明

本文仅代表作者观点,不代表Code前端网立场。
本文系作者Code前端网发表,如需转载,请注明页面地址。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

热门