Apache Hadoop 软件库是一个框架,它许可应用简单的编程模型在计算机集群上对大年夜型数据集进行分布式处理。Apache™ Hadoop® 是靠得住、可扩大、分布式计算的开源软件。
该项目包含以下模块:
- Hadoop Common:支撑其他 Hadoop 模块的常用对象。
- Hadoop 分布式文件体系 (HDFS™):分布式文件体系,可供给对应用法度榜样数据的高吞吐量拜访支撑。
- Hadoop YARN:功课调剂和集群资本治理框架。
- Hadoop MapReduce:一个基于 YARN 的大年夜型数据集并行处理体系。
本文将赞助你慢慢在 CentOS 上安装 hadoop 并设备单节点 hadoop 集群。
安装 Java
在安装 hadoop 之前,请确保你的体系上安装了 Java。应用此敕令检查已安装 Java 的版本。
- java -version
- java version "1.7.0_75"
- Java(TM) SE Runtime Environment (build 1.7.0_75-b13)
- Java HotSpot(TM) 64-Bit Server VM (build 24.75-b04, mixed mode)
- <configuration>
- <property>
- <name>mapreduce.framework.name</name>
- <value>yarn</value>
- </property>
- </configuration>
要安装或更新 Java,请参考下面慢慢的解释。
如今应用以下敕令格局化 namenode:
第一步是大年夜 Oracle 官方网站下载最新版本的 java。
- cd /opt/
- wget --no-cookies --no-check-certificate --header "Cookie: gpw_e24=http%3A%2F%2Fwww.oracle.com%2F; oraclelicense=accept-securebackup-cookie" "http://download.oracle.com/otn-pub/java/jdk/7u79-b15/jdk-7u79-linux-x64.tar.gz"
- tar xzf jdk-7u79-linux-x64.tar.gz
须要设置应用更新版本的 Java 作为替代。应用以下敕令来履行此操作。
- cd /opt/jdk1.7.0_79/
- alternatives --install /usr/bin/java java /opt/jdk1.7.0_79/bin/java 2
- alternatives --config java
- There are 3 programs which provide 'java'.
- Selection Command
- -----------------------------------------------
- * 1 /opt/jdk1.7.0_60/bin/java
- + 2 /opt/jdk1.7.0_72/bin/java
- 3 /opt/jdk1.7.0_79/bin/java
- Enter to keep the current selection[+], or type selection number: 3 [Press Enter]
- alternatives --install /usr/bin/jar jar /opt/jdk1.7.0_79/bin/jar 2
- alternatives --install /usr/bin/javac javac /opt/jdk1.7.0_79/bin/javac 2
- alternatives --set jar /opt/jdk1.7.0_79/bin/jar
- alternatives --set javac /opt/jdk1.7.0_79/bin/javac
如今大年夜官方网站 hadoop.apache.org 下载 hadoop 最新的可用版本。
下一步是设备情况变量。应用以下敕令阃确设置这些变量。
设置 JAVA_HOME 变量:
推荐阅读
Linux中Swap(即:交换分区),类似于Windows的虚拟内存,就是当内存不足的时刻,把一部分硬盘空间虚拟成内存应用,大年夜而解决内存容量不足的情况。swap分区在非高内存的办事器上必弗成少,然则swap不克不及充当内存应用。>>>详细阅读
本文标题:如何在CentOS上安装Apache Hadoop
地址:http://www.17bianji.com/lsqh/36710.html
1/2 1