大数据技术
Hadoop数据分析处理技术解析
数据的分析是大数据处理的核心。传统数据分析主要是针对结构化数据,其大致过程为:首先利用数据库存储结构化数据,在此基础上构建数据仓库,根据需要再构建相应立方体并进行联机分析处理。这一过程在处理相对较少的 ...
分类: 大数据技术
阅读全文
HBase的目录结构
第一部分文件是被Hlog处理的write-ahead日志文件,这些日志文件被保存在HBase根目录下的.logs文件夹。.logs目录下面为每一 个HRegionServer单独创建一个文件夹,每一个文件夹下有几个HLog文件(因为log rotation)。 ...
分类: 数据库
阅读全文
Hortonworks推新版HDP 提升Hadoop性能
作为以Apache Hadoop YARN架构为基础的新一代方案,HDP 2.0(HDP,Hortonworks Data Platform,Hortonworks数据平台)的出现让Hadoop从单一用途的Web规模批量数据处理平台进化为一套多用型操作系统。如今,它能 够处理 ...
分类: 大数据技术
阅读全文
数据挖掘十大经典算法
不仅仅是选中的十大算法,其实参加评选的18种算法,实际上随便拿出一种来都可以称得上是经典算法,它们在数据挖掘领域都产生了极为深远的影响。 1.C4.5 C4.5算法是机器学习算法中的一种分类决策树算法,其核心 ...
分类: 数据挖掘
阅读全文
游弋云计算大数据时代 企业用户急需一站式服务
云计算的出现不仅是一场技术的变革,更是一场商业模式的变革。云计算的价值不断在落地应用中崭露头角,而大数据的潜能也正在被逐渐的激发。2013年将有80%以上的企业采用云计算的方式构建信息系统,作为中国云计算重 ...
分类: 大数据技术
阅读全文
以“上大学分析”为例体验什么是数据挖掘
谈到BI,就会谈到数据挖掘(Data mining)。数据挖掘是指用某些方法和工具,对数据进行分析,发现隐藏规律并利的一种方法。下面我们将通过具体的例子来学习什么是数据挖掘。 案例“上大学分析”-体验什么是数据挖掘某 ...
分类: 数据挖掘
阅读全文
公有云厂商“不能说的四个秘密”
尽管我们一直在快速向公有云进,但是很多服务提供商幕后的故事却让人依旧不安。大多数利用了公有云的公司对于“那扇紧闭的门”背后的一些实践都浑然不知,甚至于他们会渴望这种无知。或者说好一点:有些事情公有云厂 ...
分类: 云技术
阅读全文
投资者的香饽饽-更环保的云
随着公有和私有云服务、社交媒体、跨设备数据同步及在线存储等服务的爆炸式增长,基于云的服务正在以指数级数扩张。各公司和服务提供商正大力投资高性能、高效率的数据中心,以满足不断增长的需求,力图保持市场领先 ...
分类: 云技术
阅读全文
数据,收集还是创造?
企业每天都受到大量信息的冲击。这些信息由邮件、社交媒体、网站和移动应用等等生成,来自于它们业务的各个方面。业界估计数据每年的增长率在30%到50%之间,对于许多企业来说,每年将增长上PB的数据量。问题显然不是 ...
分类: 数据挖掘
阅读全文
互联网金融:大数据激荡银行
银行业应该是大数据时代最激进的行业之一:互联网金融让金融边界的日益模糊、移动智能带来的产品服务转型和升级需求,利率市场化等带来的新竞争和成本压力……都在迫使这个古老而稳定的行业发生变革。而“变革”的核 ...
分类: 大数据技术
阅读全文
大数据在教育领域如何应用?
数据(data),一般而言是指通过科学实验、检验、统计等方式所获得的,用于科学研究、技术设计、查证、决策等目的的数值。通过全面、准确、系统地测量、收集、记录、分类、存储这些数据,再经过严格地统计、分析、检 ...
分类: 大数据技术
阅读全文
别老扯什么Hadoop了,你的数据根本不够大
“你有多少大数据和Hadoop的经验?”他们问我。我一直在用Hadoop,但很少处理几TB以上的任务。我基本上只是一个大数据新手——知道概念,写过代码,但是没有大规模经验。接下来他们会问:“你能用Hadoop做简单的grou ...
分类: 大数据技术
阅读全文
可视化大数据,好比双目失明的中校能够闻香识佳人
大数据还是大忽悠?作为科技领域最时髦的词汇之一,大数据带来的机遇究竟有没有被过分炒作?在2013年夏季达沃斯论坛上,这个议题以一场辩论会的形式展开。最终反方的观点胜出:作为热概念,“大数据”正在影响着传统 ...
分类: 大数据技术
阅读全文
伦敦神经科学新算法能帮你识别和过滤微博垃圾信息
当你看到的时候,你知道微博里充斥着垃圾信息——但是如果你看不到那些垃圾,是不是很爽呢?不幸的是,分析信息内容的电子邮件过滤软件对微博没有用。因为就那么140个字的一段内容,即使是合法的,读起来也像是尼日 ...
分类: 大数据技术
阅读全文
量化,教你真正读懂数据
在大数据大行其道的年代,几乎所有人淹没在数据的海洋里。马丁•克鲁贝克(Martin Klubeck)对数据追逐和草率跟风提出了忠告和建议,认为数据不过是冰山一角,对于IT企业来说,真正需要的,其实是“shine a lig ...