这是一个家居电商行业很专业的微信群,我有幸在群里有时打打酱油。这天打酱油时就遇上了一位大数据专家,于是有了下面的对话。对话完全是实话实录,不作一个字修改。只是涉及实名时,用“X”代替。
对话中括号内是我的注解。另外请注意微信对话的延迟性,所以不是严格意义的一句对一句。
故事是从微信群里上传的一篇有关一家美国家具电商怎么应用大数据开始的。
当我们打开一个电子商务网站,里面有成千上万的商品在等着我们挑选,觉得“乱花渐欲迷人眼”?当然了,可以借助“田园(田园装修效果图)风”或者“儿童床”之类的标签来筛选。但在美国家具电商Smart Furniture 的眼中, 这还不够酷,这个过程应该再提前一步, 再简化一点:在用户开始浏览前就根据用户的特征和偏好,为用户定制化的显示可能想要购买的商品。这就像在进入一个家具卖场之前,所有符合你品味的家具已经排好队在等着你了。
而要达到这样的效果,顾客只要在进入网站开始购物前进行一个简单的在线测试。 Smart Furniture 公司的家具方面的专家已经通过一种算法规则,将不同的测试结果与数以万计的产品特征进行了匹配,剩下来要做的就是在“定制化”的网页中,挑选那些打动自己的产品了。结果是,使用了该功能的顾客相比那些未使用的顾客,成交率提高了10倍。
在线测试的过程也非常简单,每个简单的问题下面都配上一幅辅助你做出选择的图片,这样更加直观和方便。
1)当然是确定你的性别。
2)确定你中意的家具风格,简约(简约装修效果图)? 欧式(欧式装修效果图)?还是现代?
3)可容纳的家具空间的大小,宽敞?紧凑?还是一般?
4)确定房间的装修风格。
5)确定购物的倾向,更注重品质还是更注重价格高低或者二者均衡?
6)选择个人休闲习惯(经常呆在在 餐厅、卧室还是家庭办公空间)。
7)户型特点(宽敞、舒适紧凑还是一般)。
8)最关注哪一点(价格、品质还是 兼顾?)。
9)喜欢什么样的办公椅(舒适、价格、外观)。
这个名为“SmartProfile”的新功能被公司称为“规范化定制”,它通过将商品与每个人的性格、偏好、家居空间、预算等特征进行匹配,为每个人展示“定制化”的商品。2013年末公司推出测试版,测试期间用户平均下单率增长了27%,于是公司决定将向所有用户提供使用。而Smart Furniture 公司的目标,是继续打造这款 SmartProfile ,为顾客创造更加直观的购物体验。
专家:定制家具与我给XX照明做的促销宝的移动应用一样。(专家第一时间出现了。)
我:这个个性化营销的概念一直吸引着很多人。但是其中的奥秘和痛点却很少有人谈。看上去这个Smart Furniture又是一个案例。(俺这话只是对案例的自说自话,不是针对专家的,因为当初俺也不太明白专家所说的定制家具和这个案例有什么关系。定制家具是一个概念,个性化营销是不同的概念。故事中的“定制化”商品,指的是个性化商品,而不是我们通常所说的定制家具。)
我:不要迷恋这种所谓的个性化营销的大数据应用,往往不会有好结果。(俺依旧自说自话。)
我:互联网的精髓就是互动。这种意义上的个性化实际是反互联网思维的。(言多必失啊!一个“互动”,引出专家的一番训导。)
专家:有限互动。
专家:不能为互动而互动。
我:此话应该反过来说,不能为个性化而个性化。互动是本质。(从这里开始俺才与专家对话。很有点不自量力。)
专家:聊天是互动,谈成生意才是本事。
我:聊天只是一种互动方式。
专家:拍拖是方式,推倒是目的。(至今不太明白,专家讲话一般都比较深奥。)
我:这样跟你解释,互联网就是要消费者掌握主动。这是互联网精神。而所谓的个性化,依旧是商家希望掌握主动权。(这哪是与专家说话应有的态度。自我检讨。呵呵。)
我:这是互联网思维。(俺也大言不惭地谈互联网思维了,惭愧。)
专家:顾客体验是唯一标准,其他只是效率而已,所以线下执行力才是核心竞争力。(专家就是专家!)
我:不讲大道理。如果你有一个个性化系统,能不能告诉我你预测用户消费需求的准确率是多少?(在俺看来,顾客体验是靠具体数字说明的。)
专家:我们就是搞这个的。仅仅通过网上数据配合,我们就可以做到40%的精准度,然后门店人工介入。(果然有数字!)
我:多少人能够达到40%?(俺想知道得到这个预测准确性的样本空间是什么。比如说,100个人上网站,有10个人用这个预测系统,那40%只有4人。)
专家:有意思吗?(从上下文看,这句话应该是在我上面一句问话之前问的。不过俺再笨也听出了专家的藐视。)
我:你把案例讲完全,才能知道是否有意思。(俺是实在人。)
专家:噪音与信号之争。(专家就是出口不凡。你懂吗?俺不懂。)
我:讲实在的。或者是你的用户听得懂的,或者是统计学者听得懂的。(俺急!专家和俺说话肯定不在一个层面上,俺真的听不懂。)
我:100个顾客上你的网站,你能预测40%?是不是太神了?!(如果不说明样本空间,那就应该理解为全样本。那样的话就真的很神奇,难道不是吗?)
专家:有效沟通可以提取信号,无限沟通产生噪音。从噪音里面提取信号,准确度是衡量这个信号的,不是从但是噪音提取信号的问题。(专家!!!)
专家:常识。(开始汗颜了!这点常识怎么也不懂,何脸去见江东父老?!)
专家:让您挂不住了?(专家,请别挖苦俺行不?俺还要在这个群里混呢。求您了!)
我:能否说些我们能够看得懂的?你说的常识可能真的没人能懂。(俺是个实在人,还是这么不识时务。)
专家:《噪音和信号》,关于大数据的一本书。(大数据,你懂吗?!唉唉,大数据压死人哎。)
我:这样讲吧,您用什么统计学原理来做预测的?(俺就是这么实在!怎么还在问什么统计学呢?那是大数据!)
专家:《信号与噪声》中涉及如下有趣又值得研究的问题:天气预报说降水概率为60%,你出门会带伞吗?被雷电击中的概率到底有多大?地震发生之前,我们真的无法预测吗?中情局为什么会忽略“9.11”恐怖袭击发生的信号?禽流感为何会突然爆发,又突然消失?为什么大数据时代的预测更容易失败?
“信号”是我们想要和需要的事实,比如能帮助我们侦破早期鞋子炸弹案的信号。“噪声”则是另一回事,通常是不相干的信息,它阻碍或误导我们搜索信号。(&……%#@+——()&%&%*¥#@&)
专家:推荐阅读。
我:太深奥了!(发自肺腑的感叹。)
我:请问你是采用什么统计方法来做预测的?(我可以获得年度最固执奖了。)
(良久无答。)
我:不至于你不用统计方法也能做预测吧?(俺在争取国际固执大奖!)
专家:您歇歇吧,大可将我视为算命的,对不起啊您。(专家果然生气了。专家不高兴,后果很严重。)
专家:就群里面发的案例,仅仅几个特征码交叉匹配就可以获得方案推荐,折腾那么复杂干嘛?(不是大数据吗?不是噪音与信号吗?怎么一下子就变成了“几个特征码交叉匹配”了呢?!难道统计方法都不用?难道统计方法比噪音和信号学更复杂?俺彻底糊涂了。)
专家:(提供一个二维码)有兴趣扫下这个吧。(依旧很专家。)
(好在此时群里有朋友出来圆场,对话到此结束。专家让俺歇歇,俺也只好歇歇了。)
这个案例,以及以上的这段对话,应该属于典型的大数据忽悠。
对话大家自己看,我这里只谈案例中的大数据忽悠。
这应该是一个为了个性化而个性化,为了大数据而大数据的典型案例。
首先,我们考虑为什么要大数据,为什么个性化。答案是为了方便用户,为了提升用户体验。可是,Smart Furniture为了这个目的,不惜要麻烦用户先回答9个问题。至少九次点击(实际上应该再加两次:开始和结束),才能够提供所谓个性化的商品。这是在牺牲用户体验去追求所谓的个性化。
如果你的网页优化得当,用户需要九次点击才能找到自己所需要的商品吗?如果你网上商品之间的关联性做好了,当用户找到自己喜爱的第一个商品时,你完全可以通过相关性为用户提供他可能喜欢的其他商品。
大数据应用的精髓在于此。粗俗地说,这个Smart Furniture的预测系统,基本上就是脱裤子放PI。
其次,这个预测系统使用了相对比较复杂的统计预测方法,而不是上面那位专家所说的只是用了“几个特征码交叉匹配”。用该预测系统所选择的九个变量来预测用户对各种商品的偏好是一项非常复杂的模型分析,而且预测的精度是十分有限的。
从故事中描述的那九个问题来看,似乎操作这个预测模型的大数据专家不是十分科学,因为他们问的那九个问题不系统,并且其中第五问和第八问似乎是重复了。或许这是写故事的人犯的错误。
我总感觉一般鼓吹或使用这些预测方法的人基本上都不很懂统计学,否则他们就不会这么大胆地敢做这样的预测模型了。可能是所谓无知者无畏吧。当然他们比那些基本上不懂统计学方法却整天拿着大数据什么的忽悠人的专家要稍强一点。
再次,衡量此系统是否有效的一个关键要素是究竟有多少比例的用户用这个预测系统。哪怕你的预测是100%准确,如果只有很少的用户实际使用你的预测系统,那你的预测系统也可能白搭。
文章介绍中提供了几个数据以说明该系统的有效性。我们来仔细分析一下这些数据,看看是否有它们看上去那么有效。“2013年末公司推出测试版,测试期间用户平均下单率增长了27%。”“使用了该功能的顾客相比那些未使用的顾客,成交率提高了10倍。”
看上去似乎很有效。但是显然,为了理解以上这两个数据真正代表的含义,我们需要把网站用户分为使用该预测系统的用户和不使用该系统的用户。再一次强调,这两者的比例是衡量该系统是否真正有效的关键。然而这个数字并没有出现。根据以往的经验,存在但不提供的数字往往是有意不提供的。
“测试期间用户平均下单率增长了27%”,这个数字的意义也含糊不清。是所有用户的平均下单率增长了27%,还是使用该预测系统的用户平均下单率增长了27%?我们对文章中这种含糊不清的表述再次表示怀疑,因为文章有充分的动机用最准确的表述来说明该系统的有效性。如果是所有用户的平均下单率增长,那和该预测系统可能就没有关系。如果是使用该系统的用户下单率增长27%,为什么不直接说明呢?!
另外,在测试期间,也可能需要通过更多的数据来优化预测算法。这27%的增长,或许来自预测系统的优化。这只说明原来的预测系统还不够好,但不能充分说明这个系统有效。
我们再来看看用户为什么要不怕麻烦地使用这个预测系统,是因为这些用户有很强的愿望在你的网站上购物!也就是说,文章中介绍的所谓10倍成交率增长的故事可能需要反过来理解:正是因为用户有很强的成交愿望,这些用户才会使用你的预测系统。因此,你的系统是否真的有效,是无法通过这个10倍成交率的增长来说明的。
更重要的是,当你把你的主要精力都集中在这个花哨的所谓大数据预测系统上后,你很可能就会忽视对整个网站的合理优化,从而导致整个网站效率的下降。
从这个案例我们可以看到,不能盲目追求大数据和个性化。大数据也好,个性化也好,都不是我们的目的。我们的目的是提升用户的体验。如果需要牺牲用户体验来实现什么大数据或个性化,那就是在耍流氓。
自从互联网发展以来,很多人都看到数据应用的潜在前景。在这个发展被大数据之前,就出现如“一对一营销”等追求个性化营销的思潮。当前大数据应用中的个性化营销,基本是继承了十几年前的“一对一营销”的思路。但是这种营销思维的理论基础是错误的,而且从方法来看也是不对的。十年前我曾在上海某高校与营销系的一批博导及博士们探讨“一对一营销”的问题,我向他们说明,所谓的“一对一营销”实际是通过市场细分的统计方法来实现的。
类似本案例的大数据应用我见过许多,很多比这个案例更让人陶醉。可是几乎没有一个最终是成功的。因为它们是反科学的,同时也是反用户体验的。
作者:唐人,家居电商实践者与探索者,专注于传统家居企业的电商发展战略及实施。
相关知识
用户体验至上:看大数据是如何“耍流氓”的?
揭秘 | 8小时全国直播突破10万单,金牌厨柜是如何做到的?
王恩勇:大数据是智慧城市的核心资源
悠易互通周文彪:技术和数据是互联网广告的基石
领跑定制家居行业14年,尚品宅配是如何做到的?
有奖调查:家庭装修大起底,你的家是如何装修的?
17家地产开发商点赞,四季沐歌超级工厂是如何做到的?
一套定制衣柜到底是如何诞生的?
一台机器搞定一日三餐 是如何做到的?
柳传志是如何“做人”的?