12月5日,由工商联家具装饰商会电商专委会主办,齐家网承办,易观智库、中国家居家装电商研究院协办的,网易家居作为战略合作媒体的2015中国家具互联网与智能大会—互联网泛家装论坛在北京西国贸酒店(酒店装修效果图)国贸大宴会厅隆重召开。众位行业精英在此共论互联网泛家装的发展。
百度资深数据科学家吴海山
吴海山:大家早上好!
非常高兴有这个一个机会代表百度参加互联网家居以及智能家居大会。刚才邓总也讲了,现在85后已经变成了智能家居主要的力量,刚好我就是其中的代表,我是85后。更巧的是我家正在进行装修。其实这几天我家里面装修的时候,我一直在思考,也跟装修公司聊,怎么样从互联网的角度提高行业的效率,能够让用户使用起来更方便,能够得到更好的服务。其实百度作为传统的互联网公司,现在也越来越重视对传统行业的改造或者对传统行业的进入。大家知道百度对传统旅游、金融、医疗、外卖、家居这种行业,我们重视的程度也越来越高。
今天我跟大家分享一下,我们怎么通过百度数据,能够帮助行业提供解决方案,能够帮助行业提高生产效率。
我先简单介绍一下,我来自百度研究院大数据实验室,其中大数据实验室是其中一个,还有深度学习实验室和美国硅谷的人工智能实验室。我们大数据实验室,主要利用百度各个行业的数据分析用户的画像,为用户提供解决方案。包括我们提供智能家居机器人、选址的解决方案等等。
大家可能比较关心百度数据来自于什么地方,百度的数据来源包括线上的数据,大家每天都在使用的搜索数据。大家知道移动互联网越来越普遍,几乎每个人都会有一个手机,这个数据现在在里面贡献的越来越多。怎么样把这里面的数据分析和挖掘,这是比较重要的部分。包括每天我们用手机去百度里面搜索,包括每天有30亿次移动互联网的搜索。这些数据在线下,用户跟百度业界最先进的定位技术,每天能够得到接近6亿用户超过250亿次的定位需求,这个数据量确实是非常大的。我们根据用户的定位需求可以知道用户线下行为,我们知道用户在网上搜了装修,我们知道他在线下去了哪些装修的地方。
这是北京一天定位数据的展现结果,这是北京一天iPhone用户的定位,我们每半个小时展现一次,大家可以看到北京数据的动态就像人的呼吸一样,这只是在北京。其实我们放眼全国来看,大数据呈现的样子是什么样的呢?这是我们用了今年2015年除夕的数据,我们把数据放上去,结果是这样的,下面没有加任何地图的结果,百度地图定位本身可以把轮廓呈现出来。如果我们再仔细看的话,比如说像山东这个区域是非常明显的,数据本身可以把很多空间细节展现出来,包括这是上海外滩的区域,路的形状完全被数据刻划出来。我们根据这些数据结合网络上的搜索数据,我们对整个城市和用户做非常详细的画像,这是我们对城市的画像,我们知道比如说像北京一天24小时人口流动的分布是什么样的,潜在的客户,他都出现在什么地方,住在什么地方,工作在什么地方。人口出行的结果是什么样的,包括刚才邓总也说,有些客户可能是比较小资的,收入比较高的,这些用户分布在什么地方,我们怎么推广,怎么更好的接触到用户,我们发现对出行的画像,包括本地游客和外地游客,在时间和空间上的分布是什么的。
有了这些数字,我可以对用户做360度的画像,根据我们的数据可以分析出来用户的结果,我知道用户是男性、年龄、收入、住址,以及我们知道他最近有没有装修的需求,这都是非常重要的画像。因为百度作为用户入口的直接需求,我们可以从百度的搜索数据看到,每天全国各地家装家居装修需求的分布。
我们从这个图来看,2015年1月份一直到最近11月份家居装修搜索结果的动态图。从3月份开始进入家居行业的旺季,其实国庆和春节反而是相反的,这是比较有意思的现象。
我们还可以根据这些数据分析行业里面的需求图谱,我们知道这是装修行业,用户的需求是什么样的,我们知道用户有客厅的效果需求,我们根据这个可以看到用户对行业不同时间的需求。
这是反映在时间上的结果,其实在画像上我们可以看到有家装需求的用户,他们的画像需求,其实男性居多,可能有比较强的购买力,女性占24%的比例。在家居群体来讲平均是30岁,这里面占了一半的用户,这可能是购买力比较强的,也是行业需要重点关注和重点推广的用户群体。
这些用户分布在什么地方呢?这个图展示了有家装需求用户在全国范围的分布,我们发现像广东、北京、江苏有家装需求特别高和旺盛的几个省份。这是跟家装直接相关的需求。
这些用户直接关注哪些信息呢?我们可以通过对百度的搜索词进行文本的分析,用机器学习和数据挖掘的方法展示,用户对家装需求的分布。比如说我们发现大部分人很关心装修效果,这是现在很多年轻人比较关心的点,接下来是客厅、户型、背景、面积大小。右边那个图展示了用户对需求的分布,可以为行业决策提供非常好的思路。
现在我们做的可能跟智能家居比较契合,我们预期现在智能家居随着移动互联网和物联网的发展,我们认为智能家居在将来可能会越来越流行,可能会越来越普遍,背后的问题就是它可能有更多的传感器来获取用户数据,来分析用户的行为,给用户提供更加智能、更加个性化的智能家居的服务。我们这边给大家提出来方案,我们先从用户的出行来看用户的行为,我们的目的是对每个用户做建模,我知道用户的喜好、偏好。
比如说将来大家会买一个扫地的机器人或者任何一个东西,它背后不是说每个人面临的都是同样的机器人,这个机器人是了解个人得,他知道你的性别、年龄、喜好、偏好,这样可以给你提供更加个性化的服务,我们从数据本身来解决这个问题。这个图代表的是什么意思呢?这是五一当天北京游客的分布,一类是在北京居住本地的游客,还有一类是来自外地来北京旅游的游客,这些游客的分布,我们发现他们呈现了非常有意思的差异。
比如说这是一类游客,他们经常去的地点,比如说天安门广场、八达岭长城、颐和园,我们发现左边是外地游客来北京首先受欢迎的地点,右边是本地的游客。用户本身住在什么地方,会对他的行为产生很大的差异,我们设计智能机器人的时候要考虑用户居住地和来源地的信息。
另外,我们发现不同手机用户在这个行为上也产生了非常明显的差异。大家可以看一下,苹果用户和安卓用户,他们对地点到访的差异是什么样的。
比如说这个是某一类用户经常光临的地方,比如说王府井、后海、798艺术区,另外一个全是公园,我们数据发现确实很明显,左边是苹果用户,右边是安卓用户。如果说我们要做一个家居机器人,它需要感受到用户到底是用什么手机,来自于什么地方,它的收入是什么样的,大的性格是什么样的,要提供个性化、智能化的服务。
根据这样一个结果,这只是智能机器人里面一小部分。包括我们可以预测用户接下来会干什么,比如说这是我们做的研究,我们可以预测用户接下来会出现在什么地方。如果你在家里面,我们预测你接下来你干什么,可以预测下一个产生的行为。蓝色的线代表用户线下的行为,我们根据这些可以用机器学习的方法建模,预测用户下一步做什么。
大家知道我们最近在百度推出产品叫度秘,他为每个人提供智能助理,我们希望把这个嵌入到智能家居,家居里面每个机器人也是非常智能化、非常个性化的助理。
举一个例子,这是用旅游为例怎么样提供个性化服务,我可以到什么地方去玩,你坐在家里休息,你问一下旁边的机器人,我周末应该去什么地方玩,它根据周边的信息和个性化的信息推荐一些比较适合你的地方。
我们最近做了一些东西,比如说我今天要去故宫玩,它会告诉你今天故宫有多少人,故宫挤不挤。它还可以实时感知用户当前的状态,它能知道用户现在在家里面,能知道用户干什么,我们认为接下来重点把机器人推广在智能家居的接口。
我们还推出一个产品百度慧选,我们根据百度的数据做商业的选址系统。刚才邓总也讲了齐家要做线下O2O的体验店,我应该放在什么位置,在什么地方开体验店能更吸引潜在客户,北京地方这么大,我在什么地方开店呢?如果人工调查的话成本特别高。通过百度数据,我们可以帮助用户提供智能自动化商业选址方案,可以帮助你选线下的体验店,其实我们这个已经应用在行业当中,告诉行业我应该在北京、上海选什么样的地址做体验店的位置。
这个图给大家反映的是用户去两个类型的地方,一个去星巴克可能小资一点,另外一个去海底捞,这两个地方永远产生完全不同的行为。星巴克用户周一到周五去的频率比较高,去海底捞周末频率比较高。包括大家在每一天的时间,对于像星巴克,大家下午三四点去的概率最高,去海底捞大家下午六点到九点去的频率比较高。
对于地点的需求也不一样,我们发现用户宁可走远一点的地方选一个更合适的海底捞,对于星巴克他们选择更加近的地方,这个其实跟我们的需求,我们可以通过百度定位搜索的数据做用户选址的方案。
假设黑色的点代表现在已有的线下体验店的位置,现在我再想选一个新的位置,应该在北京选在什么地方呢?我首先看一下最近有家装家居需求的用户分布在什么地方,黑色代表现有线下的体验店,我们把现有的线下体验店,比如说每一个体验店能够满足周边一两公里用户的需求,我把满足需求去掉,之后我们发现还有很多地方人有很强的需求,但是他在周边找不到体验店,我们认为在这个地方开体验店成功的概率是比较高的。
这是自动的算法,能够识别出来用户的需求,进行自动的建模,找到用户的位置,这是百度的慧创业,它帮助你选址,如果线下有需求的话可以跟我们联系。
我们做了几个案例,比如说我们帮助海底捞,用我们的算法帮他们算了一个位置,这个位置是在红色的,橘黄色的箭头是现有的位置,我们选择的位置跟它现在的位置是非常接近的,包括全聚德的烤鸭店也是非常接近的,这是选址应用。
另外一个应用,其实百度数据还可以反应空间上经济形态的分布。比如说现在齐家主要是在北京、上海,我想进军二三线城市,我应该选哪个城市比较好,这是比较难的问题。但是刚好百度的数据可以帮助我们分析结果,比如说我们来看全国iPhone6的分布,我们做了分析,我们看省级的GDP和省iPhone6的分布是高度相关的,比较不相关的地方是北京、上海、深圳,我们发现这几个地方用户的行为更加复杂,用户的消费和其他地方的差异可能更大一些。
我们还可以用百度迁徙数据来看中国城市的发展,比如说可以看到周边城市群的发展。现在我主要的站点在上海,我想去杭州、苏州发展的时候,我应该选哪个城市更好,我们会提供一个非常好的解决方案。
我们会对用户的数据做非常详细的挖掘,比如说不同的颜色代表不同的用户,他使用百度产品的时候产生的定位数据,我们根据这个分析用户线下的行为,包括它经常去什么地方,这对做线下精准的营销推广是非常有意义的。因为我们家居家装跟地产经济密切相关,我们通过百度数据来看中国住宅区的空置率到底是什么样的,大家知道中国有很多城市叫所谓的鬼城,这是大家比较司空见惯的。但是具体到底是什么样的,这是美国的媒体说这是中国的鬼城,这是中国河南的郑州,这是09年的报道。
中国的鬼城到底在什么地方,还有一些相关的排名,大概是什么样的。所有的结果都给大家一个宏观的结果,鄂尔多斯可能是一个鬼城,其他地方可能是鬼城,到底哪些区域的楼盘空置率比较高,哪些地方的楼盘空置率没有那么高。我们可以用百度数据来帮它分析整个中国房地产行业空置率是什么样的,发展状况是什么样的,哪些城市空置率已经没有那么高了,越来越多的人开始居住新城了。大家可以通过网站看我们空城宜居百度大数据的检测结果。
首先我们通过百度定位数据分析用户的工作地、居住地,再分析用户居住楼盘的信息,我们根据网上的数据和百度结果看这个楼盘,知道这个楼盘的容积率、建筑时间,根据这样一个结果可以检测出来全国范围内地产行业的住宅空置率的分析,这是我们检出来某一个楼盘区域空置率确实是比较高的。根据我们数据的调研,我们发现这个应该是沈阳的大运村某一块区域,这是另外一个城市的。
为了证明检测结果和网上报的结果是非常接近的。我们检测几个典型中国城市所谓的空置率比较高的空置区域。虽然说有些城市的楼盘住宅空置率有点高,但是接下来我们根据数据发现,这个现象并不是现在的媒体或者是西方媒体报道的现象,具体是什么样的,我们发现中国的鬼城可以分成两类,一类像三亚、威海,我们认为这些地方不应该是鬼城,其实在节假日的时候人口峰值涨的很高,这是典型的季节性的旅游城市,它和美国的迈阿密和新泽西是一样的。我们认为这些城市的房地产行业并没有想象的那么严重。
另外,我们还发现一个例子,之前被媒体报道比较多的河南郑州新区。根据我们的数据发现,这个地方的经济现在已经好转很多了,越来越多的年轻人搬到郑州新区去住,这个已经是复苏非常好的城市,这个地方的地产行业已经比较景气,我们更应该从长远的角度来看政府的政策在里面起的作用。
我们来看地产行业的发展,更重要的指标是看成是净增人口的变化,这是非常好的指标。如果这个城市的楼盘比较多,但是人口还是在下降,我们觉得这是比较危险的信号。如果说这个城市虽然有一定的存量楼盘,但是这个城市整体人口是上升的,我们认为这个城市在地产、家装家居,我们认为这个城市有很大的空间。
比如说澎湃新闻、麻省理工以及相关媒体对我们的报道,以及人民网和参考消息的报道,后来我们发现参考消息纸制版也对我们的研究做了报道。
我们可以从百度数据做一些数据驱动城市的规划和地产规划相关的研究。另外,我们我们通过百度数据来做智慧城市的管理,通过百度数据做城市分析。这是我们通过百度大数据做的研究,基于上海外滩的踩踏,事后我们根据百度的数据做了研究,我们发现百度地图数据可以很好的预测将来人口流动的趋势。根据这样的结果提供一些方案,帮助政府能够做人群的实时监控和预警方案,这是智慧城市的应用案例。包括城市人口的流动,以及北京通勤结果,大家可以看到有多少人住在朝阳,有去海淀和房山上班的人。比如说你住在丰台,你去其他地方上班,这是我们对智慧城市相关的研究,这是城市之间流通网络的分析,这是我们的产品结果,谢谢大家。
相关知识
【互联网泛家装论坛】吴海山:装修2.0时代下的大数据和用户画像
【互联网泛家装论坛】吴兴杰:装修2.0时代的变与不变
【互联网泛家装论坛】蔡初阳:匠心精神和齐家网F2C深度合作
【互联网泛家装论坛】卢方武:马云让天下没有难做的生意 齐家让品牌商赚钱
【互联网泛家装论坛】邓华金:互联网泛家装发展机会和挑战
【互联网泛家装论坛】葛延松:装修用户注意力迁移 互联网原住民驱动行业变革
【互联网泛家装论坛】陈辉:没有创新的互联网泛家装 等于耍流氓
【互联网泛家装论坛】邓华金:齐家网升级装修2.0 拥抱变化共创未来sfs
【2015互联网泛家装论坛】于扬:数据重塑产业链互联网+家装行业转型
多品类集成战略7:高层管理的思想统一 | 7.8中国互联网泛家装论坛