大数据Hadoop集群安装教程之环境配置

来源：千锋教育

发布人：小千

时间： 2021-05-12 15:16:00 1620803760

大数据Hadoop是非常常用的开发环境，但有不少同学在环境配置上面出现了问题，下面小千就来带大家顺一遍环境配置的方法。

大数据

安装Hadoop集群时要确保以下几个方面, 参考下面检查工程

1. 本机与虚拟机之间是否可以通信

1.1 本机防火墙关闭（开启情况是本机可以ping虚拟机，虚拟机不能ping本机）

1.2 虚拟机是克隆的情况（按照Linux文档中，修改ip地址等方法）

1.3 虚拟机设置--网卡是否是仅主机模式或者桥接模式：仅主机模式需要检查VMware1网卡设置与虚拟机网卡设置是否匹配。桥接模式是为了让虚拟机可以连接外网，只需要改该虚拟机网卡信息即可（网关）

2. 虚拟机之间是否可以通信

具体的一些命令操作

2.1关闭本机网络管理

/etc/init.d/NetworkManager stop

chkconfig NetworkManager off

2.2关闭防火墙

chkconfig iptables off

service iptables save

3. 更改主机名称

vi /etc/sysconfig/network

4. 更改主机与ip映射

vi /etc/hosts

5. 安装JDK和hadoop

5.1 安装

tar -zxvf jdk-7u79-linux-x64.tar.gz –C /usr/local

tar -zxvf hadoop-2.7.1.tar.gz -C /usr/local/

5.2 重新设置hadoop,jdk的所属组,所属人

chown root:root hadoop-2.7.1 javajdk

5.3 hadoop的目录理解

1）bin:hadoop最基本的管理脚本和使用脚本所在目录,这些脚本是sbin目录下管理脚本的基础实现,用户可以直接使用这些脚本管理和使用hadoop

2）etc:hadoop配置文件所在的目录,包括core-site.xml,hdfs-site.xml,mapred-site.xml,yarn-site.mxl等文件

3）include:对外提供的编程库头文件(具体动态库和静态库在lib目录中),这些头文件均是用c++定义的,通常用于c++程序访问hdfs或者编写mapreduce程序

4）lib:该目录包含了hadoop对外提供的编程动态库和静态库,与include目录中的头文件结合使用

5）libexec:各个服务对应的shell配置文件所在目录,可用于配置日志输出目录,启动参数(比如JVM参数)等基本信息

6）sbin:hadoop脚本管理所在目录,主要包含hdfs,yarn中各类服务的启动/关闭脚本

7）share:hadoop各个模块编译后的jar包所在目录

6. 修改系统环境变量

6.1 到/etc/profile下进行修改

export JAVA_HOME=/usr/local /java/

export HADOOP_HOME=/usr/local /hadoop-2.7.1/

export HIVE_HOME=/usr/local/hive/

export ZOOKEEPER_HOME=/usr/local /zookeeper/

export

PATH=$PATH:$JAVA_HOME/bin:$ZOOKEEPER_HOME/bin:$ZOOKEEPER_HOME/conf:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$HIVE_HOME/bin:

6.2 使修改后的系统生效

source /etc/profile

6.3 测试

java –version

hadoop version

7. 克隆

主机台数:3台

名字:master slave1 slave2

8. 设置免密登录

8.1 方式一选其一

进入cd /root/.ssh 执行

ssh-keygen -t rsa

ssh-copy-id master@root 自己对自己免密

ssh-copy-id slave1@root

ssh-copy-id slave2@root

8.2 方式二选其一

解释:-t 是要生成的密钥类型 -p 是原来的旧密码,没有就写'' -f是密钥生成后保存文件的位置 (这些都可以不写,取默认的)

ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa

cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

scp ~/.ssh/authorized_keys slave1:/root/.ssh/

scp ~/.ssh/authorized_keys slave2:/root/.ssh/

最后如果你对大数据开发感兴趣的，不妨来千锋大数据培训班了解一下我们的大数据学习课程，全程名师面授，现在还有免费大数据学习资料可以领取，赶紧来看一下吧。

声明：本站稿件版权均属千锋教育所有，未经许可不得擅自转载。

大数据实时计算引擎Spark笔试题：Spark Catalyst查询优化器原理

大数据技巧|消息系统Kafka的常见问题

猜你喜欢LIKE

相关推荐HOT

更多>>

索引有什么作用?在mongodb中索引分为几类

索引(Index)是数据库中的一种数据结构，用来提高数据检索的效率。它们可以帮助数据库系统快速地定位和访问需要的数据。在 MongoDB 中，索引也很...详情>>

2023-04-11 13:43:47

主键约束是什么意思?如何实现mysql主键约束

主键约束是一种在数据库中用于保证表中某个列的唯一性和非空性的约束，该列将成为表的主键。主键的作用是为了唯一标识表中的每一行数据，以方便...详情>>

2023-03-17 16:51:01

eureka和zookeeper的区别对比

Eureka和Zookeeper都是服务发现和注册的工具，但它们有以下几个不同点：架构设计：Eureka采用了集中式的架构，其中一个服务作为Eureka Server，...详情>>

2023-03-07 15:35:18

Zookeeper和Eureka的区别都有哪些？

Zookeeper和Eureka都是分布式系统中常用的服务发现和注册组件，它们的主要区别如下：数据一致性：Zookeeper是一个高度可靠的分布式数据一致性解...详情>>

2023-03-07 15:26:19

zookeeper和eureka的区别介绍

1.架构设计：ZooKeeper是一个分布式的协调服务，它提供了高可用、高可靠性的数据存储和协调服务，可以作为分布式系统中的一个通用组件使用。而E...详情>>

2023-03-03 15:00:46

大数据培训问答 更多>>

新

大数据都学什么？5大核心知识必学内容有哪些

新

大数据报班多少钱？如何选择培训机构

新

人工智能学什么？自学可以成才吗

新

数据处理包括哪些内容？是不是所有课程需要分别报课

新

大数据分析需要学什么？怎么学比较好

新

人工智能专业学什么？人工智能有哪些课程

新

大数据数据分析师要学什么？好就业吗

大数据面试题库 更多>>

大数据的五个V是什么?

涨薪指数

数据及集群管理（三）

涨薪指数

数据及集群管理（二）

涨薪指数

大数据的五个V是什么?

数据及集群管理（三）

数据及集群管理（二）

数据及集群管理（一）

大数据之hbase的优化读数据方面

大数据之hbase的优化写入数据方面

大数据师资团队 更多>>

开班信息

北京校区

北京校区
大连校区
广州校区
成都校区
杭州校区
长沙校区
合肥校区
南京校区
上海校区
深圳校区
武汉校区
郑州校区
西安校区
青岛校区
重庆校区
太原校区
沈阳校区
南昌校区
哈尔滨校区

14天品质课程免费学

10年以上业内强师带你蜕变精英

提交领取