在北京,90后在租房方面更舍得花钱、三十多岁是男性买房的高峰期、女性全款买房的比例更高。这些与房子有关的一个个结论,是针对房产大数据分析的结果。在大数据时代,信息的挖掘与应用已经成为多个行业的竞争的焦点。

链家技术副总裁惠新宸

在房产领域,链家在十年前就开始着手房产大数据的建立。链家集团董事长左晖曾表示,“数据的价值非常大,但形成有价值的数据会比较难。一旦在消费者数据上形成这一能力或获得领先优势,是很高的门槛。我们更希望借助数据的力量,加速房屋的流通,稳定房地产市场。推动行业更加规范透明,引导用户理性消费。”

解决痛点

长久以来,中国的二手房市场存在不少“痛点”:信息不对称、虚假房源、部分从业人员良莠不齐,这些问题导致了业主买房需要承担较大风险。近年来,由于大数据的建立、互联网+时代的到来,二手房市场的这些 “痛点”,正在逐步得到解决。

链家算法大赛现场

链家技术副总裁惠新宸讲述,在我刚毕业的时候,很多中介还是靠信息不对称来赚钱。随着大数据的发展,这种情况已经无法持续,链家一直坚持“真房源”的原则,也就是房屋真实存在、真实在售、真实价格、真实图片,链家一直在努力消除这种信息的不对称。

在房地产经纪行业,如何提高客户成交效率,是最为重要的环节,而大数据的应用可以让这项任务变得轻松一些。惠新宸表示,链家的大数据主要分为“人、房、客”三条线,数据处理的过程就是在这三个连接点上做工作,让信息做到无差别分享,提高他们的连接效率,促进购房决策,减少交易过程中的不确定性。

除了促进成交外,大数据工作还可以帮助经纪人提升业务素质。经纪人应该是一个专业的服务者,不仅仅是一个简单的撮合,更多的时候是要给双方提出一个专业的咨询,这就需要努力提升经纪人的从业能力。我们可以通过大数据,去收集经纪人的行为,发现他们的弱点,通过培训提升他的服务能力。

上述“痛点”的解决,均是在链家的大数据的基础上进行的。链家从2008年就已开始建立“楼盘字典”,目前已囊括全国36个城市7500万套房屋的标准信息,拥有1200TB数据量,每套房屋由300个字段描述,还用200个维度定义用户,155个维度定义经纪人,在此基础上形成的包括带看、交易在内的行为数据,每天超过30G。

突破难点

房产大数据在解决用户痛点上起到了很大的作用,但在具体操作过程中还存在诸多难点。惠新宸表示,链家是以数据驱动的全价值链房产服务平台,平台上有大量的客户、大量的房子,以及大量的经纪人数据,发展到一定的规模之后,链家就有了一定的社会责任,这就需要我们去做“难而正确的事”。

惠新宸提到,“目前大数据业务最难的不是技术问题。有时候遇到一个问题,你思考怎么去用数据的方式解决它,有的时候需要的是一种观念的改变”。

为了推动大数据的发展,链家举办了链家算法大赛暨2017计蒜之道的比赛。惠新宸表示,链家此次举办算法大赛,开放真实的房源数据,就是希望能让专业领域的学生在学习过程中突破理论,与实际生活相结合。同时,链家也期望有更多优秀的程序设计人才加入企业,一起将数据背后的价值挖掘出来。

目前链家大数据中,描绘一个房子有300多个维度,“真正的要描绘一个房子的价值,可不只是300多个维度”,惠新宸提到,“链家房屋智能评估已经上线一年多,不同的小区之间不同的模型,房屋估价很复杂,要做到特别精确非常非常难。我们有的时候会发现在北京精装修的房子反而不如不装修的房子贵,这些都是要靠我们不断的去努力的摸索和提升,让房屋的估价越来越准。”

新的尝试

除二手房交易外,大数据同样可以为开发商提供数据支持。目前,链家已与多家地产开发商达成了战略合作关系。

惠新宸表示,当开发商要进入一个城市的时候,对这个城市的教育指数、医疗指数等方面是比较感兴趣的。另外,链家可以为开发商提供的用户画像,比如一个区域的可能性的购房者是谁、购买力是多少、对房屋的期望值是什么,这些因素可以帮助开发商有针对性的去做产品设计。

惠新宸介绍,目前链家的产品和技术团队将近800人,在大数据领域,链家一直在做一些新的尝试,包括新房业务,上海的家居业务等。