ad

打开《OpenStack 云平台-部署与高可用实战》_7.2.1 HBase 的安装部署

网友投稿 109 2023-11-13

【摘要】 本书摘自《OpenStack 云平台-部署与高可用实战》一书中第7.2.1节,肖睿 雷宇飞主编。

7.2.1 HBase 的安装部署

与 HDFS 、MapReduce 不 同 ,HBase 需要单独安装。下面开始安装 HBase 。 首 先 下

载HBase压缩包,注意要使用和Hadoop 相对应的HBase软件包。本案例中使用hbase-1.0.2

版本。执行以下命令将其解压到NameNode(nodel) 上。

[hduser@nodel ~]$tar zxvfhbase-1.0.2-bin.tar.gz

切换到HBase 解压目录,可以查看 HBase 的目录结构下面是对 HBase 各目录的说明。

打开《OpenStack 云平台-部署与高可用实战》_7.2.1 HBase  的安装部署

● bin: 包含可执行命令与脚本。

● conf: 配置文件存放目录。

● docs: 包含配置文档。

·hbase-webapps: 存储 Web 应用的目录。通过这些应用可以查看 Hbase 的运行状 态。默认访问地址为http://Master:16010, 其 中 ,Master 为 HBase Master 服务器地址。

· lib: 存放 HBase jar文件目录,包括第三方依赖包以及 Hadoop 相关jar 文件。其 中,与 Hadoop 相关jar 包最好能与实际运行的 Hadoop 版本一致,以保证稳定运行。

HBase 的 conf 目录下提供了hbase-site.xml 文件,可以对其进行自定义配置。通过对 hbase-site.xml 文件采用不同的配置方式,HBase 可以在单机、伪分布式和完全分布式模 式下运行,其中运行完全分布式 HBase 需要以下条件。

● JDK 环境

● SSH 免密码登录

● Hadoop 环境 1. 单机模式

HBase 软件解压后即可直接在单机模式下运行,只需要在hbase-site.xml文件中指定 HBase 的文件存储目录即可,如下所示。

hbase.rootdirfile:///home/hduser/hbase

其 中 ,hbase.rootdir 指定了 HBase 数据存储目录。注意:选项值对应 Linux 系统的 文件目录。运行以下命令启动 HBase。

bin/start-hbase.sh

启动成功后可以查看当前运行的进程,如图7.8所示。在单机模式下运行的 HBase

进程仅有HMaster 进程。

nter,l. ]omt -1.0.2/bin/./logs/hbase-hduser-master-nodel.out

[hduserenodel hbase-i.0.2]s jps

4538 HMaster

4685 Jps

图7.8 启动HBase

启动后 HBase 会自动创建 hbase.rootdir 目录,其中的文件数据如图7.9所示。

2. 伪分布式模式

在伪分布式模式下,HBase 只在单个节点上运行,这和单机模式一样,只是其数据 文件可以存储在HDFS 分布式存储系统中。配置伪分布式模式,只需要在 hbase-site.xml

文件中将 hbase.rootdir 的值更换为 HDFS 文件系统即可。对应的配置如下。

hbase.rootdirhdfs://node1:9000/hbase

指定 HDFS 目录后,需要启动 HDFS, 如图7. 11所示。

Thduseranodel hbase-1.0.2]5 ~/hadoop/sbin/start-dfs.sh

tne[,ilg to /home/hduser/hadoop/logs/hadoop-hduser-namenode-nodel.out

Starting secondary namenodes [nodel]

nodel;starting secondarynamenode,logging to /home/hduser/hadoop/logs/hadoop-hduser-secondarynamenode-nod

[hduserenodel hbase-i.0.2]s jps

5616 NameNode

5809 SecondaryNameNode

6050 HWaster

6253 Jps

在执行完伪分布式配置操作后,会在HDFS 中生成 hbase 目录。此时要先删除 hbase

目录,才能进入下面的完全分布式配置模式。

[hduser@nodel hadoop]$bin/hdfsnamenode -format

3. 完全分布式模式

完全分布式模式是将HBase 运行在多个节点上。通常是将HBase 的 HMaster 运行在 HDFS 的 NameNode 上,而将 HRegionServer 运行在 HDFS DataNode 上。

本章采用 HBase 完全分布式模式。在此模式下需要在 conf 目录下配置三个文件,分 别 是hbase-site.xml 、hbase-env.sh 和 regionservers 。 首先在 nodel 节点上进行配置,随后 将整个 HBase 安装目录复制到其他节点上。

在配置前需要先做一些必要的清理工作。

● 如果之前执行过伪分布式模式的部署,需要先删除 HDFS 中已经存在的 “hdfs://node1:9000/hbase”目录。

● 配置所有节点的时间同步,且时钟误差不能大于30秒。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们 18664393530@aliyun.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:打开《Python 可视化数据分析》_学会挖掘大数据的价值_3.3.3 函数调用
下一篇:实战之路《Excel 数据处理与分析实战宝典_第2版》_2.6.7 删除重复数据
相关文章

 发表评论

暂时没有评论,来抢沙发吧~

×