跳过本内容页

请提供下面的信息以登录进入您的 账户,必须填写的信息已经被 加粗和用 (*)标出

必填信息

账户参数

  1. 忘记密码?
没有帐号?点击注册
手机注册 邮箱注册

必填信息

  1. 只能使用字母、数字和符号,将会在您参加的任何讨论或论坛上显示(之后将无法更改) (以后不能更改)

账户致谢

  1. 服务条款

    诚信准则

已有账号? 点击登录
Hadoop入门及实战
基于当前大数据技术的普及和企业的需求,大数据开发已经逐渐成为互联网行业中越来越重要的一支,本课程会带领大家学习Hadoop的基础知识与实战实例。
试学 该课程招生全部经由邀请
  1. 课程开始

    2016/12/06
  2. 学时

    4小时/周,8周
  3. 程度

    基础
  4. 学习人数

    46

关于本课

本课程第一部分对Hadoop做了整体的介绍,同时介绍了分布式计算的思想;第二部分动手搭建一个本地的Hadoop集群;第三部分介绍了时下流行的分布式文件系统hdfs并介绍了如何与hdfs交互;第四部分以实例的方式介绍了如何开发一个mapreduce,选取了数据处理中集中常见的操作,学习本章后就能开发一些初级的mapreduce应用。第五部分深入Hadoop的工作机制,剖析Hadoop的内部细节,对继续深入学习Hadoop有很大的帮助。第六部分讲了HadoopIO的内容,这部分内容对mapreduce作业的优化以及开发高级的mapreduce应用都有很大帮助。第七部分对第二代Hadoop系统做了比较详细的介绍。

主讲教师

刘学成

刘学成

毕业于辽宁工程技术大学。三年互联网开发经验,曾任职当当网大数据开发工程师,参与当当大数据精准营销系统研发。现就职于58赶集集团大数据开发工程师,负责商业大数据的相关研发工作。精通大数据领域hadoop,hive,spark等技术,并有丰富的实践经验。

课程目录

第一章 初识Hadoop及分布式计算
  1. 第一节 初识hadoop及分布式计算
第二章 Hadoop安装与配置
  1. 第一节 配置ssh及安装java
  2. 第二节 配置Hadoop伪分布式集群
  3. 第三节 Hadoop集群安装及配置
第三章 hadoop分布式文件系统
  1. 第一节 hdfs体系
  2. 第二节 使用JavaAPI操作hdfs
  3. 第三节 hdfs高级特性
第四章 mapreduce程序开发实战
  1. 第一节 开发环境配置及helloworld
  2. 第二节 运行mapreduce
  3. 第三节 mapreduce典型案例之数据去重
  4. 第四节 mapreduce典型案例之数据排序
  5. 第五节 mapreduce典型案例之两表关联
第五章 mapreduce工作机制
  1. 第一节 mapreduce作业执行流程
  2. 第二节 容错机制
  3. 第三节 mapreduce数据处理核心之shuffle和排序
  4. 第四节 mapreduce任务执行
第六章 hadoop io操作
  1. 第一节 数据压缩
  2. 第二节 序列化
  3. 第三节 mapreduce文件类型
第七章 hadoop YARN
  1. 第一节 YARN概述
  2. 第二节 设计细节
提示
?

学习这门课程,你必须同意自动注册数据大学(BIGDataUniversity.com.cn)。

将为您创建登录邮箱为,密码为的账号
(注:如果在数据大学已经注册该邮箱,请使用原密码登录)