淘宝搜索引擎的详细工作步骤
一、提取并推荐
淘宝搜索引擎工作的第一步是“猜”,不管是关键词搜索,还是类目搜索,还是其他的,淘宝搜索引擎工作的第一步是“猜”一下买家到底想要的是什么,然后把猜出来的结果提取并推荐出来。比如,用户在输入“猫”的时候,搜索引擎会“猜”你想要的是上网用的那种电子设备,而不是我们家里养的宠物猫咪,那么它提取并且推荐给你的也都是上网用的调制解调器,搜出来的店铺也都是数码类的店铺,如图:
淘宝搜索引擎的这个猜的过程分为三个阶段:
(1)第一阶段:匹配词
淘宝的搜索系统会对用户的关键词搜索行为进行积累,并进行概率统计,可能是最近30天的,也可能是最近一年的。比如,淘宝的搜索系统通过对用户搜索“苹果”这个关键词进行概率统计分析,发现在最近一年,几乎所有的用户搜索苹果的时候,点击的都是手机,而不是我们吃的那种水果。
这样,再有用户搜索“苹果”时,淘宝的搜索系统会猜这个用户也想要一个“苹果”手机,从而把苹果手机推荐给用户,而不是推荐我们吃的苹果水果。
(2)第二阶段:分配类目
接下来,淘宝会对提取出来的商品进行类目的匹配。比如搜索“苹果”的时候,有“手机专用配件”类目,有“手机”类目,还有“儿童玩具”丶“有机食品”等类目。淘宝会优先展示红框里面的类目,因为淘宝总共展示4004个商品,所以粉红框里面的宝贝就不会被展示出来。
(3)个性化搜索
淘宝所追求的个性化搜索就是根据买家上网时所留下的痕迹(比如:曾经买过什么样的宝贝,曾经把哪些商品放入了购物车,收藏过什么样的宝贝或者店铺等等),去判断用户的本次搜索会倾向于要什么样的宝贝。个性化搜索目前从价格丶性别丶品牌丶爱好丶地域等方面来看,很多的排序已经取得了不错的效果。从以上的三个内容我们可以看出来,商品的宝贝标题是给淘宝搜索引擎的“猜测”的系统看的。
二、排序
淘宝的搜索引擎通过“猜”的方式将它认为可能是用户需要的商品提取并推荐出来后,就要对这些宝贝进行排序。搜索引擎要告诉你,这些宝贝中谁好谁不好。这就需要它进行一番计算,也就是我们常说的淘宝搜索引擎的“算法”(多少seo的从业者为了这个算法绞尽脑汁)。
当然,我们是不可能知道淘宝的搜索引擎的具体算法的,就像你肯定不知道百度的算法,不知道谷歌的排名规则是一样的,这个算法一定会作为高度商业机密,只有少数人掌握的。这样做是为了最大的公平,如果算法公开,那么就会有很多人把优化工作的重心放在去迎合搜索引擎算法上,而不是去认真的去提高用户体验,去优化自己的产品服务。
虽然不知道淘宝搜索引擎的具体算法,但是在淘宝搜索的官方帮派中,我们还是可以去分析一下它排序的计算方式。淘宝搜索引擎排序的主要计算方式分为两部分:
(1)考量店铺的静态分部分
这部分的分值是考量店铺的。用淘宝的江湖文化来比喻,我们可以把这部分分值看成是内功的高低,是习武者的底子。如果有两个武功招式的基础都一样的人,同时开始练武,再不考虑勤奋度等因素的情况下,内功底子好的人一定比内功底子差的人练得好。这部分静态分可以分为三种:
第一种:店铺模型部分
这部分主要是考量店铺的整体情况是不是健康的,是不是正常的,是最基础的因素。包括店铺的好评率(目前,好评率已经不影响搜索排序了)丶是否被处罚丶是否被举报丶是否被投诉丶店铺装修的基本情况等等。
第二种:产品模型部分
这有一个很重要的考量指标:动销率。商品动销率的计算公式为:动销品种数库存的总品种数*100%。动销品种数指的是所有商品种类中有销售的商品种类总数。这个指标是评价店铺各种类商品销售情况的。
我们都知道在淘宝中有一个滞销商品的概念(90天内没有任何一笔交易的宝贝叫做滞销商品),滞销商品在搜索排序中是要被降权的。从这个意义上来讲,店铺的动销率越高越好。
当动销率小于100%时,从数据的表面看,是店铺内的商品存在滞销的情况,产生的原因有很多,主要包括:
品种过多,特别是同质同类品种过多。
上架品种的结构有问题。
不动销商品的淘汰力度不够或者淘汰与购进不成比例。
不动销商品在店铺内的布局丶促销等策略需要调整。
一般的动销率低时的解决方法有:
加强数据分析以及对消费者的消费习惯丶消费心理进行调研。根据消费者的需求适度丶谨慎上架新的商品品种。
重新上架不动销的商品(宝贝标题丶详情页丶价格等因素进行变更);加大不动销商品的促销力度;改变不动销商品的营销策略。
通过综合数据分析,如果确定某单品数月内动销数为零,采取了一定的促销手段后仍无起色,就应考虑下架。
但是我们要切记一点:绝大多数商品不动销的原因并不是商品本身的错,而是策略的问题,没有最大限度的挖掘和发挥该商品的销售潜力,也就是说没有能够有效的找到该商品的卖点并有效的加以利用。
第三种:主营类目模型
在淘宝网发展的早期,许多卖家都没有明确的定位,把自己的店铺当成了大杂货铺,什么商品好卖就上架什么商品。但是随着2012年淘宝所提出的“小而美”的概念,有明确定位丶专门针对某一类细分人群的店铺将会在未来的淘宝搜索中获得更多的推荐(这是符合商业本质的,每一个企业都需要有自己明确的定位)。
淘宝本身就是一个超大的巨型超市,在这个超市里面可以有卖不同商品的各种专柜和摊位。但是,淘宝可能不是很看得惯在自己的这个巨型超市里面还有一些小超市存在。因此,作为一个淘宝店铺来讲,必须明确自己主营的东西是什么,不要什么都卖。
比如淘宝集市第一店柠檬绿茶,因为早期的飞速发展,曾经一度几乎什么都卖。但是随着淘宝的发展,柠檬绿茶也在不断的调整自己的主营品类,目前定位成“精品家居”专卖。这样做既符合淘宝“主营”的要求,也给了自己一个明确的定位,从而更好的服务消费者。
店铺中所经营的一级类目越多,对于店铺分越不好,专一才是王道。比如你的店铺中既有男装丶又有女装,那么这两个类目,不管任何一个类目做的比较好了(比如男装的销量要明显好于女装),那么淘宝就会认为该类目是店铺的主营类目,从而影响另外一个类目在搜索中的排名。
前面说过,店铺的静态分就相当于习武者的内功功底。不要认为只会一个招式就可以天下无敌(比如只有爆款丶只会上活动丶只会开直通车),一定要是基础好才能有一个健康的店铺。
(2)考量产品的动态分部分
在考量宝贝后的动态分里面,因素非常的多,因为后面还会有详细的介绍,所以我们在这里做一个简单的说明:
第一种:关键词模型部分
淘宝的搜索引擎会判断一下某个关键词是不是有很多的卖家喜欢搜索,搜索人气很高的时候淘宝会优先推荐,这种优先推荐体现在很多的方面,比如:
搜索框下面的搜索热词
在搜索框中搜索某个关键词时在下拉菜单中出现的推荐词
类目界面特殊颜色的词
第二种:客单价模型部分
同样一件商品,淘宝上不同卖家的价格是有较大差别的。淘宝搜索引擎会通过对以前数据的积累,并进行统计分析(每个价格段有多少人购买的概率),然后优先展示购买概率最高的那个价格段的商品。我们通过观察会发现,淘宝上同样一款商品,销量最好的并不是价格最低的(当然也不是价格最高的),而是价格适中的。
第三种:类目模型部分
你的商品只有跟“提取并推荐”这个阶段宝贝在类目属性上非常相关,不能弄错。相关性越高,排名越有可能靠前。
第四种:反馈模型部分
这个反馈指的是用户从搜索关键词开始,对所看到的的搜索结果中的商品做出的所有反应。比如说:
看到宝贝后,是否点击;点击进入页面后,是进去就出来了,还是进行了深度浏览;有没有点击客服进行了相关的咨询;
有没有收藏;是不是购买了;购买后有没有评价丶分享……这些都属于反馈的内容。
第五种:轮播模型部分
为了公平起见,淘宝搜索引擎所采用的最公正的方式就是轮播(轮番展示所有的商品)。而轮播中最关键的因素就是下架时间,下架时间越靠近,排名越靠前。
对于考量产品的动态分部分,我想起了这样一件事儿:
去年年底的时候,一位朋友,家里是果农,但是因为各种原因导致苹果滞销。她给我寄来了一箱苹果,我觉得确实物超所值,就在微博上做了一次小规模的微博营销。在营销的过程中,我学习到了一种对于苹果的评价标准:苹果的直径。行内人会说75的果丶80的果等等,指的就是这个苹果的最大直径,一般来说,直径越大的苹果单价就会越高。
这些苹果在刚摘下来的时候都是混在一起的,运到家里后,果农们就会根据苹果的大小丶颜色丶外观等进行筛选,把最好的苹果(直径大丶颜色好丶长相好)卖最贵的价格,最差的苹果卖较低的交割。淘宝通过第一阶段提取并推荐出来的宝贝,就像是刚摘回来的苹果,排名比赛时就是挑苹果的过程,有不同的指标,各个指标又有不同的权重。
作为一个购物搜索,淘宝的搜索引擎里面有一个特别出色的功能:自我学习。它会把所有的搜索结果全部都保存下来,目的只有一个,就是为了统计概率。它会看在某一段时间内,搜索什么的,反馈的概率是怎么样的,然后把最高概率的拿出来首先推荐给搜索用户。
该文转自《亿邦动力网》
飞流
简介: 聚连高级营销顾问、数据运营分析师,8年电商运营经验,店铺销售额过亿,擅长数据分析与运营规划,对于基础推广到全链路运营有独到的见解,对于家具、母婴、建材、家装、五金等类目直...