搜索
收藏本版 |订阅

Hadoop 今日: 0|主题: 220|排名: 12 

作者 回复/查看 最后发表
超越Hadoop,Luigi助大数据创业公司提供云服务
新的大数据开源技术和工具往往来自互联网公司,除了Facebook、Google和Twitter这样的巨头外,一些甚至是你想不到的互联网公司,例如Netflix和Spotify(音乐流媒体服务)也会贡献一些优秀的大数 ...
Yafei 2014-10-16 01756 Yafei 2014-10-16 15:24
Hadoop之父Doug Cutting:Lucene到Hadoop的开源之路
Doug Cutting,凭借自己对工作的热情和脚踏实地的态度,开创了Lucene和Nutch两个成功的开源搜索引擎项目,同时也是当下人气大数据计算框架Hadoop的创立者。Doug于1985年毕业于美国斯坦福大学, ...
菜鸟之家 2014-10-16 01998 菜鸟之家 2014-10-16 15:25
Hadoop 2_0 NameNode HA和Federation实践
一、背景天云趋势在2012年下半年开始为某大型国有银行的历史交易数据备份及查询提供基于Hadoop的技术解决方案,由于行业的特殊性,客户对服务的可用性有着非常高的要求,而HDFS长久以来都被单点 ...
herosrx 2014-5-20 02422 herosrx 2014-5-20 15:54
AMD皓龙A系列平台实现首次Hadoop演示
2014年10月8日,旧金山讯--AMD公司(NYSE: AMD)近日首次公开展示了基于ARM? Cortex?-A57的AMD皓龙?A系列处理器运行Apache? Hadoop?的演示。在JavaOne?大会的一个技术讲解会上,AMD公司院 ...
小雨涵 2014-10-16 01777 小雨涵 2014-10-16 15:26
AMD皓龙A系列平台实现首次基于ARM Cortex- A57的Hadoop演示
AMD 公司(NYSE: AMD) 近日首次公开展示了基于ARM® Cortex®-A57的AMD皓龙™A系列处理器运行Apache™ Hadoop® 的演示。在JavaOne™大会的一个技术讲解会上 ...
idata 2014-10-16 01676 idata 2014-10-16 15:28
释放潜能 Hadoop技术不断发展
在当前的大数据领域,随着大数据技术的深入应用,业界对于Hadoop技术的关注也日渐高涨,就Hadoop本身而言,Hadoop的开源架构逐渐深入适应企业环境,其疯狂的发展势头已无法阻挡。其全新独特的数 ...
idata 2014-10-16 01937 idata 2014-10-16 15:30
hadoop集群搭建方式——加米谷大数据 新人帖
第一步:搭建配置新的虚拟机 格式化之前先把tmp目录下所有与Hadoop有关的信息全部删除rm -rf /tmp/hadoop-centos*开启之后jps只有Java的进程:sudo vi /etc/hosts 里面加 bogon1.sudo赋权Root用 ...
加米谷大数据 2017-12-19 01552 加米谷大数据 2017-12-19 13:59
打造Hadoop“中国心”--原英特尔副总裁加盟星环
   近日,星环信息科技(上海)有限公司(星环科技)迎来了原英特尔中国研究院院长、全球副总裁方之熙先生的加盟。他将在星环科技担任CRO(Chief Research Officer,首席研究官),共同打造企业级Ha ...
编辑小王 2014-10-16 01922 张小川 2014-10-16 15:31
改变世界的第四种力量—大数据【转载】
世界著名未来学家托夫勒曾说改变这个世界的力量有三种暴力、知识、金钱,而如今我们的世界正在被第四种力量改变,那就是大数据!  —— 题记   也许你不知道什么是大数据,但是你一定发现了 ...
思数云教育 2015-11-23 01335 思数云教育 2015-11-23 10:28
MapReduce: JT默认task scheduling策略
如果没有自己定制的调度策略,MapReduce就采用自带的JobQueue策略分发task。这种基于FIFO的策略挺简单,能满足基本的业务需求,但缺点也很明显,如不能实现job的实时性、所有TT的执行能力对用户 ...
herosrx 2014-5-20 02550 herosrx 2014-5-20 17:38
MapReduce:job在Job Tracker上的初始化
这篇来说道说道job在到达Job Tracker后会有哪些动作,涉及上篇job生命周期的第五步和第六步。因为job在初始化后紧接着需要应付Job Tracker对Task Tracker的task分发响应,所以我们从Job Tracker ...
小雨涵 2014-5-20 02513 小雨涵 2014-5-20 17:39
大数据分析:从感性决策到理性决策【转载】
自人类有史以来,从未像现在这样积累如此多的数据,也从未如此繁重的数据分析工作。我们都知道,挖掘大数据背后的价值能给的决策带来预测和指导,但是如何挖掘数据、掌控数据,就成了摆在眼前的 ...
思数云教育 2015-11-24 01290 思数云教育 2015-11-24 13:13
MapReduce: Job提交过程
初学Hadoop,准备用几篇日志来陈述MapReduce job的生命周期中job提交、task分发和task执行,以及JT scheduling策略,job性能参考等方面的知识。通过代码及参考资料想了解job执行的大致细节,期 ...
IT市场 2014-5-20 02436 IT市场 2014-5-20 17:40
MapReduce Join联结实现
一、背景 早在8月份的时候,我就做了一些MR的Join查询,但是发现回北京之后,2个月不用,居然有点生疏,所以今天早上又花时间好好看了一下,顺便写下这个文档,以供以后查阅。 二、环境 JDK 1.6 ...
admin_bigdatas 2014-5-20 03388 admin_bigdatas 2014-5-20 17:42
HBase性能调优
因官方Book Performance Tuning部分章节没有按配置项进行索引,不能达到快速查阅的效果。所以我以配置项驱动,重新整理了原文,并补充一些自己的理解,如有错误,欢迎指正。配置优化zookeeper.s ...
bigdata 2014-7-3 02064 bigdata 2014-7-3 17:11
【深圳站】大数据运维工程师——Hadoop管理员认证培训
2018年11月29日-12月2日 深圳市南山科技园高新南一道赋安科技大厦A座401 一、培训特色 1. 标准的课程体系及原厂商认证的授课讲师 与美国同步的原厂课程、经过层层考核的授课讲师,保证了 ...
LEE88 2018-10-24 01010 LEE88 2018-10-24 16:00
MapReduce原理浅析
一个简单的应用了Map/Reduce模式的例子:http://wiki.apache.org/hadoop/WordCount 用 Mapeduce 来处理大数据集的过程, 这个 MapReduce 的计算过程简而言之,就是将大数据集分解为成百上千的 ...
林伯海 2014-5-20 02189 林伯海 2014-5-20 17:43
MapReduce TopK统计加排序 新人帖
Hadoop技术内幕中指出Top K算法有两步,一是统计词频,二是找出词频最高的前K个词。在网上找了很多MapReduce的Top K案例,这些案例都只有排序功能,所以自己写了个案例。 这个案例分两个步骤, ...
潇洒子弦 2014-5-21 07784 潇洒子弦 2014-5-21 13:25
Hive优化之数据倾
在做Shuffle阶段的优化过程中,遇到了数据倾斜的问题,造成了对一些情况下优化效果不明显。主要是因为在Job完成后的所得到的Counters是整个Job的总和,优化是基于这些Counters得出的平均值 ...
bigdata 2014-5-21 02468 bigdata 2014-5-21 15:00
如何确定 Hadoop map和reduce的个数
阅读本文可以带着下面问题: 1.map和reduce的数量过多会导致什么情况? 2.Reduce可以通过什么设置来增加任务个数? 3.一个task的map数量由谁来决定? 4.一个task的reduce数量由谁来决定? 一 ...
bigdata 2014-5-21 02848 bigdata 2014-5-21 17:58
下一页 »

快速发帖

还可输入 80 个字符
您需要登录后才可以发帖 登录 | 立即注册

本版积分规则

 
 
大数据行业交流
大数据行业交流
大数据求职招聘
大数据求职招聘
站长电话:
15010106923
微信联系:
hb-0310
站长邮箱:
ab12-120@163.com
大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2024-5-5 01:21 , Processed in 0.070966 second(s), 13 queries .

返回顶部 返回版块