搜索
查看: 1538|回复: 0

【上海站】大数据运维工程师——Hadoop管理员 认证培训

[复制链接]

13

主题

0

回帖

227

积分

中级会员

积分
227
发表于 2018-9-12 16:26:27 | 显示全部楼层 |阅读模式
2018年10月27日-10月30日
一、培训特色
1.标准的课程体系及原厂商认证的授课讲师
与美国同步的原厂课程、经过层层考核的授课讲师,保证了我们的课程的规范化与标准化。大数据技术不同于其他学科技术,非常的新,发展也非常迅速,技术的迭代也使得我们的课程在不断更新。就目前来看,我们的课程涵盖的大数据运维、开发、分析方面,已处于市场领先地位。
2.课程设计合理
知识体系层层递进,从基础开始逐渐深入,深入浅出授课,使学员更易于学习掌握。理论加实验的授课方式使课程更丰满。
3.重底层、讲原理
为学员提供虚拟环境实战的同时,不放弃理论深度,以理论带动实际操作,使学员不仅仅只是一个纸上谈兵的理论者,更有动手的实力。

二、培训目标
为期4 天的Hadoop 管理员培训将帮助学员综合理解并全面掌握对Hadoop机群的运维管理,包括:安装,配置、负载平衡及性能调优等。通过该培训,Hadoop系统管理员将能准备好应对实际运维中遇到的挑战。
通过讲师在课堂上的讲解,以及实操练习,学员将学习以下内容:管理机群的特性,譬如日志汇总、配置管理、报告、报警及服务管理。YARN、MapReduce、Spark及 HDFS的工作原理。如何为你的机群选取合适的硬件和架构。如何将 Hadoop 机群和企业已有的系统进行无缝集成。如何使用Flume 进行实时数据采集以及如何使用Sqoop在RDBMS和Hadoop机群之间进行数据导入导出。如何配置公平调度器为 Hadoop 上的多用户提供服务级别保障。产品环境中 Hadoop 机群的最佳运维实践。Hadoop 机群排错、诊断问题和性能调优。

三、培训对象
面向系统管理员和IT经理,需具备Linux 经验,无需Apache Hadoop 基础。

四、培训证书
培训结束并顺利通过考试后,颁发Cloudera全球认证证书,证书全球通用。
证书可作为专业技术人员职业能力考核的证明,以及专业技术人员岗位聘用、任职、定级和晋升职务的重要依据。
如图123

五、培训大纲

  
课程介绍
  
  
名称
  
  
Cloudera   Administrator Training for Apache Hadoop
  
  
第一天上午
  
  
Apache Hadoop 介绍   
  
•  Hadoop 动机   
  
•  基本概念   
  
•  Hadoop 核心部件
  
Hadoop 机群安装   
  
•  机群管理方案     
  
•  Hadoop (CDH) 安装
  
Hadoop 分布式文件系统 (HDFS)   
  
•  HDFS 特性   
  
•  读写文件   
  
•  NameNode 内存考虑   
  
•  HDFS 安全简介   
  
•  HDFS Web UI   
  
•  使用 HDFS Shell
  
  
第一天下午
  
  
Hadoop 分布式文件系统 (HDFS)   
  
•  HDFS 特性   
  
•  读写文件   
  
•  NameNode 内存考虑   
  
•  HDFS 安全简介   
  
•  HDFS Web UI   
  
•  使用 HDFS Shell
  
YARN 上的 MapReduce 和 Spark      
  
•  计算平台在 Hadoop 里扮演的角色      
  
•  YARN:机群资源管理器   
  
•  MapReduce 概念   
  
•  Apache Spark 概念   
  
•  Yarn 上的计算平台   
  
•  YARN Web UI 及 Shell   
  
•  YARN 应用运行日志
  
  
第二天上午
  
  
Hadoop 配置及服务运行日志   
  
•  定位配置参数及进行配置变更   
  
•  管理角色实例及添加服务   
  
•  配置 HDFS 服务      
  
•  配置 Hadoop 服务运行日志      
  
•  配置 YARN 服务
  
向 HDFS 导入数据      
  
•  使用 Flume 从外部数据源实时导入数据      
  
•  使用 Sqoop 从关系数据库导入数据      
  
•  REST 接口   
  
•  导入数据的最佳实践
  
  
第二天下午
  
  
Hadoop 机群规划   
  
•  规划考虑因素   
  
•  硬件选择   
  
•  虚拟化选项   
  
•  网络因素   
  
•  节点配置
  
Hive,Impala 及 Pig 的安装及配置   
  
•  Hive   
  
•  Impala   
  
•  Pig Hadoop
  
  
第三天上午
  
  
客户端及 Hue   
  
•  什么是 Hadoop 客户端      
  
•  安装及配置 Hadoop 客户端      
  
•  安装及配置 Hue   
  
•  使用 Hue 进行身份验证及授权
  
机群高级配置   
  
•  高级配置参数   
  
•  Hadoop 端口配置   
  
•  HDFS 机柜感知配置   
  
•  HDFS 高可靠性配置
  
  
第三天下午
  
  
Hadoop 安全   
  
•  Hadoop 安全的重要性   
  
•  Hadoop 安全性概念   
  
•  Kerberos 简介   
  
•  使用 Kerberos 保护 Hadoop 机群   
  
•  其他安全特性
  
资源管理   
  
•  使用静态服务池配置 Linux cgroup     
  
•  公平调度器   
  
•  配置动态资源池   
  
•  YARN 内存及 CPU 设置      
  
•  Impala 查询调度
  
  
第四天上午
  
  
机群维护   
  
•  检查 HDFS 状态      
  
•  机群间复制数据   
  
•  添加/移除机群节点   
  
•  机群数据负载平衡   
  
•  目录快照   
  
•  机群升级
  
  
第四天下午
  
  
机群监控及排错      
  
•  监控 Hadoop 机群      
  
•  Hadoop 机群排错   
  
•  常见配置不当问题
  
报名请联系2790264852(Cloudera认证)
  





本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

 
 
大数据行业交流
大数据行业交流
大数据求职招聘
大数据求职招聘
站长电话:
15010106923
微信联系:
hb-0310
站长邮箱:
ab12-120@163.com
大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2024-4-20 00:54 , Processed in 0.107185 second(s), 25 queries .

快速回复 返回顶部 返回列表