乐读窝

新零售实战宝典

乐读窝 > 哲学心理 > 新零售实战宝典

大数据究竟意味着什么?

书籍名:《新零售实战宝典》    作者:商业评论



数据在商业运作中重要性的飞速上升,使大数据在当下成为了一个热门的概念。但大数据到底“大”在哪里,它对于商业运作究竟意味着什么,却没有得到充分的讨论。

当数据是全方位、实时产生的时候,企业内的管理和企业间的协作就越来越像互联网一样,要求网状、并发、实时的协同了。



自从人类从农业社会进入工业社会以来,商品的生产和流通就不仅仅是物质的转变和移动,同时也包括对各种商业信息的处理。钱德勒在《信息改变了美国》一书中甚至认为,从报纸、邮局、电报、电话一直到今天的互联网,美国人已经为进入信息时代准备了300多年!他特别提到,在这一进程中,19世纪末、20世纪初,企业采用了多种办公设备,引入了科层制管理,由此才能对企业内部信息进行有效的记录、存储、检索、分析和交流。沿着钱德勒的思路可以发现,此后很长时间里,虽然信息处理领域经历了一轮又一轮的技术革命,但在总体上,受制于IT技术的就绪度和普及率,事实上只有少量比较关键的数据得到了记录、收集、整理和分析。而且严格地说,这类数据其实更接近于加工后的信息,只是对复杂商业世界的一种简化,而不是实时、全方位的裸数据。

随着云计算带来的海量数据收集、存储和计算能力的飞跃,原则上所有商业活动中产生的数据都可以被收集下来。全面实时地收集所有的商业数据,必然会远远超过原来可以想象的规模,因此它才会被称做“大”数据。而物联网的价值也在于通过各种设备的联网,自动实时记录更多的数据。

数据量的飞升,带来了商业运作逻辑的根本变化。当商业活动围绕少量的重要数据展开时,企业内的管理和企业间的协作是单向的、线性的。而当数据是全方位、实时产生的时候,企业内的管理和企业间的协作就越来越像互联网一样,要求网状、并发、实时的协同了。

更具体地说,在云计算和大数据之前,商业运作的基本过程是“结构化的数据附着于结构化的流程”,而现在的情势则正在转向“非结构化的数据驱动非结构化的流程”。

这一多少有些绕口的判断,解读的钥匙在于对“结构化”的理解。

从数据的角度看,企业拥有的商业数据,可以分为结构化数据、半结构化数据和非结构化数据三类。结构化数据主要是指关系型数据库里可以用二维表来表达的数据,而半结构化数据和非结构化数据,则主要是视频、图片、文档、网页、声音等。在过去,企业能够运用和处理的主要是结构化数据,虽然这类数据在企业总体数据中占的比重实际上很低,大约只有1%〜5%,但由于企业在产消关系中占据着主导地位,而且企业内外的商业环境也相对稳定,因此这类附着于相对稳定的、结构化的商业流程而产生的结构化数据,成为了企业运用和分析的主体数据。

互联网、云计算的到来,让企业的商业环境发生了巨变。今天商业环境的基本特征是企业主导地位逐渐丧失,员工和消费者等个体,则正在获得极大的主导权,而且也是数据产生的主要来源(姑且不论来自物联网等物理设备的数据)。这一方面让企业要面对的数据具有了“自下而上、自外而内”的特性——员工持有的多样化的终端设备,挑战着企业固有的IT架构及背后的管理流程,海量消费者所产生的数据更是如此;另一方面,持有多样终端的员工和企业之外的消费者所产生的数据类型,主要都是文本、视频、图片等非结构化的数据,这在根本上改变了企业所拥有和需要运用的数据类型。而且,这类非结构化的数据并不必然地附着于企业的流程。实际上,大部分情况下它们都漂移于企业固有的商业流程之外,甚至是先于,也不依赖于企业流程而存在,有很强的自主性,而企业的商业流程则越来越必须对这类先期出现的数据做出响应——换句话说,如果仍然借用“流程重组”的概念,那么接下来的“流程重组”,其基本特点将是非结构化的数据驱动非结构化的流程——以消费者为中心的、非固化的、灵活动态的商业流程协同!

用更通俗的话来说,此前数据是商业决策的附庸,对于管理只起到辅助作用。典型如企业内部的BI部门,就是定位于通过数据分析帮助高管做决策。但这样的模式无法利用好今天大部分的新数据。而在互联网时代,全方位的实时数据直接驱动商业决策,企业必须改变自己的流程来适应流动的、非结构化的数据,而不是对数据削足适履。最适合这种数据特征的运作模式将是一张新的网:实时协同的价值网。

在工业时代线性控制的逻辑下,企业内部表现为流水作业和科层制结构,在企业之间则表现为线性的单向供应链,其基本特性是:集中化所导致的单向化、片面化分工,单向化传送(以企业为中心向消费者交付产品);每个环节上都由单一角色(专门化)执行预设的功能(每一个企业和个体都变成了“螺丝钉”);供应链各角色之间是“线性串联”和紧密耦合的关系。

而在互联网时代网状协同的逻辑下,企业内部开放化、社区化,在企业外部则表现为以消费者为核心的网状协同的在线价值网,其基本特性是:分布式所导致的多元化分工,多向化互动(消费者与企业的紧密互动);价值网里每一企业的角色都随消费需求而变,并在不同价值网里扮演多样化的角色;价值网里各角色之间的关系是“超链接”和松散耦合的关系。

因此,云计算与大数据的协同演化,特别是大数据在近年来看似突兀的崛起,其实正说明了IT技术发展半个多世纪至今,才真正开始有能力去支撑、映射、驱动真实商业世界的运作。



网状协同的实现过程


大数据的分享/交换,是网状协同运作逻辑中最关键的一环。由特定的共享/交换机制所连接起来的企业之间(B2B)以及企业与消费者之间(B2C)的协作,才能让大数据在流动中发挥巨大价值——既然知识必然地分布于不同的个人和组织之中,那么唯有通过分享和交换机制,让大数据流动到有相关知识的个人或组织那里,才能够挖掘出它的价值。阿里集团定位为“数据分享的第一平台”,“相信别人更聪明”,能够更好地利用阿里的数据,即是基于这一思考。

近期天猫网推出的聚石塔产品,定位于打造一个能够支撑海量商家、大量第三方服务商(如IT、物流等)和电商平台(即天猫网)之间在线实时协同的云平台,它为观察网状协同的运作,提供了一个基本的雏形。

长期以来,快速发展的天猫网商家在IT领域面临着诸多困难:自有IT系统的安全性和扩展性不够,在“双11”这样的大促活动中暴露出缺乏弹性的窘境;与天猫网的数据交互效率不高,在大促活动中有时会出现丢单、漏单;商家、服务商使用的各类软件由于不能实现互联互通,数据无法实现快速流动,数据孤岛的现象极大地加剧了业务流程的复杂性。

针对上述问题,聚石塔向商家及第三方服务商提供了安全稳定、弹性升级、随买随用的阿里集团的云资源,如云主机、云存储等,使得商家和服务商的数据与业务流程由此能够实现云化,从而在快速变化的电商行业中拥有足够的IT可靠性与灵活性。

此外,聚石塔还具有数据推送、数据集成的功能。在数据的推送方面,此前商家与天猫网的数据交互,是一种通过数据接口的抓取模式,这种基于公网的传送方式效率比较低,且容易出错。而在聚石塔的云平台上,基于阿里内网的数据推送代替了基于公网的数据抓取——天猫网会将数据快速、高效地推送到商家的数据库里。

在数据集成方面,聚石塔将会形成统一的电商数据总线和接口标准,使各个软件系统都与这一数据总线实现协同,同时通过确定订单状态的数据标准,使订单动态在各个软件之间实现快速流转。最终,聚石塔将通过把会员信息、商品信息以及交易信息等数据进行处理、整合、开放和共享,使商家所使用的IT服务商的各类IT系统之间最终实现彼此连通。

聚石塔还只是一个早期尝试的产品,它肯定会随着环境的变化而快速调整。但它已经初步体现了基于云平台的、由数据分享所驱动的、各类商业主体的业务流程之间网状、快速、实时协同的业务模式雏形。