Linux ·

Hadoop 2.2.0单节点的伪分布集成环境搭建

Hadoop版本发展历史

  第一代Hadoop被称为Hadoop 1.0

    1)0.20.x

    2)0.21.x

    3)0.22.x

  第二代Hadoop被称为Hadoop 2.0(HDFS Federation、YARN)

    1)0.23.x

    2)2.x

    3)2.2.0     稳定版本     Namenode     HA

    4)2.4     ResourceManager    HA

    5)2.6     稳定版本

    6)2.7     jdk1.7

Hadoop角色部署

  Hadoop的安装模式分为三种:

    1)单机模式:默认的安装模式,占用资源少,不需要修改配置文件,且完全运行于本地,不需要与其它节点进行交互,也不需要使用HDFS文件系统和加载任何守护进程,主要应用于开发调试MapReduce应用程序。

    2)伪分布模式:也即单节点集成模式,其所有守护进程都运行在同一台机器上(比如Namenode、Datanode、Nodemanager、ResourceManger和、SecondaryNamenode等);这种模式增加了代码的调试功能,可查看内存情况、HDFS的输入和输出、以及其它守护进城之间的交互。

    3)全分布模式:主要用于生产环境,且在实际应用中均使用分布式集群。

    考虑到大家学习时的硬件条件限制,我们将安装第二种伪分布模式并将Namenode、Datanode、Nodemanager、ResourceManger和、SecondaryNamenode配置到同一节点。

Hadoop环境安装准备

  CentOS系统

    版本:6.5

  JDK

    版本:1.7.0

  Hadoop

    版本:2.2.0 稳定版本

  注意:为了避免许多不必要的错误,以上各环境位数应该保持一致,我们选择为64位。

Hadoop伪分布环境搭建

  安装过程主要分为三步:JDK安装、.SSH无密码访问配置和Hadoop环境配置

  1. JDK安装

  首先使用Xshell工具登陆到虚拟机环境下(虚拟机安装及配置点击此处跳转:CentOS 6.5的安装详解,在此感谢“大数据躺过的坑”博主为我们提供的如此详尽的介绍),首先检查是否已经安装JDK,在命令行下输入java -version命

令,结果如下图所示:

Hadoop 2.2.0单节点的伪分布集成环境搭建 Linux 第1张

  很明显现在我们还没有安装JDK,于是接下来我们就一起来学习如何从零开始搭建我们的JDK环境。

  首先,查看我们Centos系统位数:file /bin/ls;结果如下,我们的Centos系统为64位,所以我们的JDK、SSH和Hadoop也必须保持位数一致。

Hadoop 2.2.0单节点的伪分布集成环境搭建 Linux 第2张

  我们先在usr目录下创建个java目录作为存放JDK的目录:首先进入根目录cd /,列出目录信息ls,然后进入usr目录,并创建java目录mkdir java,此时java应该为空目录,如图所示:

Hadoop 2.2.0单节点的伪分布集成环境搭建 Linux 第3张

  然后,将本地下载好的jdk1.7.0包放到本地目录,再使用rz命令上传。首先,我们先运行rz命令,检查是否已经安装此命令。结果如图(由于我已经安装过此命令,下图为网上找到错误示例图):

Hadoop 2.2.0单节点的伪分布集成环境搭建 Linux 第4张

  很明显,如果第一次使用一定是没有安装的,接下来我们先安装此命令(如果已经安装的则跳过以下rz工具包安装过程)。我们运行在线下载命令即可直接进行安装:yum -y install lrzsz(yum为包管理器,可帮助我们快速实现在线下载,-y命令可在下载后直接安装而跳过其中的询问过程,推荐使用)

Hadoop 2.2.0单节点的伪分布集成环境搭建 Linux 第5张

  此图显示的即为安装过程,如果出现下图所示信息,则表示安装完成。

Hadoop 2.2.0单节点的伪分布集成环境搭建 Linux 第6张

  接下来,我们使用rz命令上传jdk1.7.0包(前提得先下载好放到本地,可到官网自行下载:http://www.Oracle.com/technetwork/java/javase/downloads/index.html),运行日志命令后会弹出以下选择框进行上传文件选择,我们选中下载好的包上传即可。

Hadoop 2.2.0单节点的伪分布集成环境搭建 Linux 第7张              Hadoop 2.2.0单节点的伪分布集成环境搭建 Linux 第8张

  此时,输入ls命令查看即可发现文件已成功上传:

Hadoop 2.2.0单节点的伪分布集成环境搭建 Linux 第9张

  运行tar zxvf jdk-7u79-linux-x64.tar.gz命令进行解压,解压完成后再使用ls命令进行查看,此时可看到已经成功解压出来了,接下来的关键步骤是设置JDK环境变量。

Hadoop 2.2.0单节点的伪分布集成环境搭建 Linux 第10张

  我们依次运行下图中命令即可创建java环境变量的脚本文件

Hadoop 2.2.0单节点的伪分布集成环境搭建 Linux 第11张

  进入后输入“i“进入编辑模式,在此模式下想文档中写入一下内容:

    Hadoop 2.2.0单节点的伪分布集成环境搭建 Linux 第12张

  输完以上内容之后,先按Esc键退出编辑模式,然后按下Shift+;组合键并输入wq或x保存退出。此时,直接输入java -version命令还是会出错(如下图所以),为什么呢?

Hadoop 2.2.0单节点的伪分布集成环境搭建 Linux 第13张

  因为我们此时只是生产了该配置文件,但它还没有生效,所以需要使用source命令使其生效,然后再运行就成功了。

  到此,JDK的安装就已经完成了。肯定很多人会问我为什么不把命令全部输出来,那大家拷贝粘贴多方便,而要采取截屏的方式展示,那我有必要说一下我的想法。首先,截屏能让大家对于我的操作理解得更形象一点,而不会有种云里雾里的感觉;再者,学习本身就是一个实践的过程,如果大家只是复制粘贴,那本博文就没有任何意义了,我希望各位能亲身体会Linux的环境以及操作,这样才能真正起到学习的作用。所以,希望大家不要复制粘贴我的命令,而是自己完完全全敲上一两遍,自己去切身体会一下Linux系统本身,以及各命令的语法和作用机制。

参与评论