多语言展示
当前在线:1675今日阅读:2今日分享:31

如何安装分布式hbase?分布式hbase安装详解

大数据挖掘和云已经是IT技术圈内最热的词语,云就不说了,绝对是让少部分IT人好起来,而大部分IT工程师活得更惨的物件。前几天,国家也出台了大数据纲要,为了今后能不被淘汰,要抓住大数据的机遇,赶紧补充这方面的知识。
工具/原料
1

hapdoop已正常启动

2

免SSH登录已配置

方法/步骤
1

下载hbase的安装包,hbase和底层的hdoop有一定的关联适配关系,应可能下载相配套的版本,可以少走很多弯路,下载后传到预定为hbase master的主机上。小编的版本比较老,hadoop为0.20.2,hbase是0.95.5

2

hbase的安装很简单,用tar命令解压缩即可使用,不会与其它包产生互相依赖关系,但运行的前提是java和hapdoop都已经正确安装,而且确定已经能够启动hadoop软件。

3

解决完成后,进入到前一步hbase的解压目录,进到conf子目录,需要修改一些配置文件后,hbase才能正常启动,如下图所示,主要是三个文件hbase-env.sh、regionservers和hbase-site.xml。

4

hbase-env.sh是hbase的环境配置文件,需要 将JAVA_HOME和HBASE_MANAGES_ZK进行修改,其中java_home目录代表java在本机的安装目录,HBASE_MANAGES_ZK取决于zookeeper是否单独安装,如和小编一样象省点事,就用hbase自带的,需要将HBASE_MANAGES_ZK前的注释去掉,赋值为True。

5

regionservers文件的修改很简洁,只要把所有的datanode主机名写入该文件即可,需要注意的是如果把hbase的master是单独安装的,那不需要将不参与数据分布的机器名写在这个配置文件里。

6

hbase-site.xml配置文件缺省是没有配置项的,需要写入的信息较多,具体如下图所示,至少需要配置hbase.rootdir、hbase.cluster.distributed、hbase.zookeeper.quorum、hbase.tmp.dir四项。其中hbase.cluster.distributed按下图配置即可。

7

hbase.rootdir为hadoop的配置,因此需要与本机hadoop的配置一致,具体文件可参见hadoop的conf目录下的core-site.xml中fs.default.name下的属性,如下图所示。

8

hbase.tmp.dir项要注意的是配置中目录,一定要预先建立,系统不会自动创建,否则hbase是无法正常启动的。hbase.zookeeper.quorum下配置的机器数需要是单数,双数将无数启动。

9

所有hbase的主机用scp命令从已安装的机器上复制整个hbase安装目录,复制完成后,可能需要修改hbase-env.sh中java_home配置,如果所有主机的配置都一样,就不需要作修改

10

在hmater主机上键入./start-hbase.sh命令启动数据库,不需要在其它节点执行。正常启动后在mater上有两个进程,HMaster和 HQuorumPeer;数据节点上有HRegionServer和HQuorumPeer进程。

11

全部安装完成后,可以用URL的方式来检验是否正确安装,具体格式为:http://hmaster—IP:60010;如下图所示,如安装正常,将url能打开,且能看到所有节点的情况。

注意事项

有用就投票点赞支持下呗

推荐信息