袁斌:然后请李超看看,因为传统行业里面,可能大数据相对来讲没有互联网应用的多,比如从你了解的情况会怎么样? 李超:我从四个比较典型的行业大概说一下相关的情况,一是医疗行业,然后有权威的一个数据预测到2020年,医疗数据将增加到35GB,相当于2009年的44倍。其中影像数据增长最快,然后其次就是电子病历数据。然后医疗他这么大增长量的来源主要包括四类,一是制药企业和生命科学的这些科研类的数据,二是临床决策支持,还有其他临床应用,包括诊断相关的影像。三是费用报销,费用利用率和欺诈监督,四是患者行为的社交网络的一些分析数据。那么大数据在医疗这块能够体现四个方面的价值,一是加强个体化的医疗,第二是能够提高临床决策支持,第三是能够加强欺诈检测,第四是能够通过对生活方式和行为方式引发疾病进行分析来创造价值。 在金融行业的信息化中, 与大数据相关的核心业务正在越来越重要,那么金融行业在十二五期间,主要体现了十二五转型方面,主要是三个方面,一是将加强风险管理向严监转型,二是从粗 放式管理向精细化管理转型,三是从利润中心和保单中心向客户中心转型。大数据在加强这几个方面都具有特别重要的意义。然后第四个是电信行业,因为大数据时代的到来我们电信运营商,增强竞争优势,拓展蓝海新业务带来了很多新的机会,然后电信运营商可以运用大数据提高管道智能化水平,然后更加精准地洞察客 户需求,提高行业信息化的能力和水平。再一个是交通行业,交通行业也是体现在四个方面,一是交通管理,对交通流量计划、完善交通法规,自适用交通控制,这 些方面都有较大的提升。第二是涉及到旅行者信息服务,涉及到实时路矿的查询,支持旅游者多样的终端,第三是商用车辆的监管,这也需要大量的数据的运算和处 理,第四是公共安全和视频监控。大概行业应用我先举这四个方面的例子。 袁斌:其实刚才两位都讲了很多有关在行业方面的运用情况,那么其实我觉得这个理解,第一个是大,数据量会比 较多。是速度,还有就是容量,还有是类型,然后可能还有会加上类似于价值,这是有不同的说法。但是就是不管怎么说,两都是其中一个特别重要的话题,我们刚 才也讲到提到一个数,说35GB,可能大家对这些数字没有一个特别明晰的概念,我给大家举个例子,现在的话就是常见的一个数据,一个存储单 位最小的可能就是B,就是一个字节,然后就是一个比特,然后再往上是千字节,就是KB,然后是MB,然后是GB,然后是TB,还有是EB、ZB、YB,可 能现在的话我们知道的就是差不多常见的,现在比较常见的单位可能是TB,就是我们现在去买一个硬盘可能就说2TB,然后我们用了一个光盘,就是一百分钟, 他可能是8.5GB,实际刚才也提到,就是我们现在用的最大的一个,比如说BB,就是这个单位的话相当于一个可以存十一万部D9的片子。然后这个数你再去 对应一下,相当于说2TB的硬盘相当于是五百亿个,就是这个数特别特别大,但是真正要说起来这个大数据,就是要做起来的话,就是因为刚才讲的大数据,他要 去解决的时候,可能就是在后台会遇到不同的问题,就是说在技术上可能就会遇到很多的难点,实际上可能就是刚才讲的,第一个就是数据存储的问题,然后就是针 对这个技术的话,可能你存完之后要快速地对这些数据进行一个处理,这个就是一个处理的问题,然后处理完了还有说你的系统扩展,要有一个快速的扩展能力,同 时的话你刚才已经把那些数据采集上来了,采集上来以后就是数据已经有了,但是你要把那些数据怎么把它变得有价值,这个才是真正的大数据的一个利益所在,就 是说你把所有的数据都收集到了,就像刚才说的,比如在互联网行业里面他有很多的用户的行为数据,有用户的销售数据,就是说像这个数据平台里面,他作为的数 据都有了,但是你怎么把这些数据进行分析,然后得出一个结果来,然后把它变成一个对应的价值。这些才是我们去做大数据的最终的目的。所以从这个角度来看 呢,就是大数据,他其实可能会涉及到,比如说一些存储方面的技术,这个是一个基础,就是说你怎么去把这些数据存起来,然后去利用,然后可能会说快速地去做 处理,然后就是很快地响应。 然后最核心的是说我要从这些数据里面,然后找出来他的一个价值,这个就是一个分析和决策。这样的话才是真正的一个大数据的核心。所以在这些方面的应用上面,就是互联网行业里面和传统行业里面,可能在应用上就会有不同的一些想法。 曹增光:我简单说一下,因为刚才李超其实也谈到了,就是在两个行业里的应用,包括电信和金融。其实我们最近也发现,就是有一个新闻,发现阿里,其实当然他是在内部发行这种类型虚拟信用卡似
的这样的产品,那么这样的产品首先他是对这种传统的研发,因为研发本身也要有这种信用卡,然后他的信用卡基于用户的信用,比如他是通过咱们传统的,比如说
办信用卡,有可能需要你填表,然后需要你填你基本的情况,包括你的收入,你的风险意识什么的。其实就是说阿里他要做这件事情呢,他也是基于他已有的,比如
像淘宝网,
他有五亿的用户,那么五亿的用户他也都是这种交易性的数据,实时地有资金流的往来。那么他对于这种信用卡,比如说对这种额度的控制,对这种风险的感觉,其
实他有更实时或者更真实的来对用户的数据。其实这一点我觉得也是在这种互联网行业里,就是说互联网和金融,就是说他是一个结合性的一个行业里的一个重要的
应用。刚才就是袁斌也谈到了,就是说大数据,其实他有几个特点,比如说他的这种实时性,因为他不跟以前似的,有可能是过去已经产生的数据。另外他也的确是
多样性,其实在互联网里,其实这几个大数据的特质都体现的特别突出,因为互联网本身就是一个动态,实时性很强的行业,比如在电商行业,那么我一个产品上线
之后,我在几分钟,或者在多长时间内,然后我产生了多少交易,用户对商品的喜好程度,这些购买产生的这些数据,他都是这种实时性的,那么对于一个电商平台
他必须根据这些实时的数据然后进行这种分析和挖掘,然后去预测比如说这个商品在未来多长时间内他会产生多大的交易量,那么我的库存,我的供应链系统,怎么
能够更好地随时去根据这些来自于一线的这些实时的交易数据,然后去做动态的响应,保证我不至于这个商品卖得很火,然后我的库存里又不能没货了,然后我的供
应链系统也没有为之去准备,就是没法去做这样的响应。那么这样的情况下我们可能就会错失很多商机。其实之前在淘宝的
这种不管是双十一还是双十二中,其实在中小的淘宝的卖家里面其实就发生了很多这样的情况,就是有一些卖家觉得双十一肯定会大卖,然后他就准备了很多商品,
但是他对这种用户的数据,或者实时性无法做出很准确的这样的分析,就会导致他整个在双十一期间,有可能投入了很多的推广,或者各方面的,包括刺激消费的措
施。但是在商品的这种提前备货,包括供应链的体系上面没有做好准备,那结果就是他有可能得不到他对应的这些价值。基本上另外一个方面就是对于大数据影响最
广泛的,其实在这种网络营销的精准上面,那么这个刚开始一开始也谈到了,其实就是根据用户的行为然后去分析,去得出不同的用户,然后有可能根据他的不同的
兴趣爱好或者偏好,或者是他实时性的一些需求,比如说我现在想买一个汽车,我想买一家电,那么你是不是知道我这里的需求,然后这个需求有可能是一个大量的
数据量的,然后根据用户的需求去匹配相应的信息。就是目前互联网应用大数据特别特别广泛,也特别多。目前基本的状况是这样,反正是就是应用比较早,然后应
用的这种范围,包括在各个产品的,包括前端的体验,其实都有很广泛的应用。 |