zookeeper
Zookeeper
入门
工作机制
从设计模式角度来理解,是一个基于观察者模式设计的分布式服务管理框架,负责存储和管理大家都关心的数据,然后接受观察者的注册,一旦这些数据的状态发生变化,ZK就将 负责通知已经在ZK上注册的哪些观察者 做出相应的反应。
特点
1)Zookeeper:一个领导者(Leader),多个跟随者(Follower)组成的集群。
2)集群中只要有 半数以上节点存活,Zookeeper集群就能正常服务。所以Zookeeper适合安装奇数台服务器。
3)全局数据一致:每个Server保存一份相同的数据副本,Client无论连接到哪个Server,数据都是一致的。
4)更新请求顺序执行,来自同一个Client的更新请求按其发送顺序依次执行。
5)数据更新原子性,一次数据更新要么成功,要么失败。
6)实时性,在一定时间范围内,Client能读到最新数据。
数据结构
ZooKeeper 数据模型的结构与 Unix 文件系统很类似,整体上可以看作是一棵树,每个节点称做一个 ZNode。每一个 ZNode 默认能够存储 1MB 的数据,每个 ZNode 都可以通过其路径唯一标识。
应用场景
提供的服务包括:统一命名服务、统一配置管理、统一集群管理、服务器节点动态上下线、软负载均衡等。
下载地址
1) 官网首页:
https://zookeeper.apache.org/
下载linux环境安装的tar包。
ZK本地安装
本地模式安装
1、安装前准备
(1)安装 JDK
(2)拷贝apache-zookeeper-3.5.7-bin.tar.gz安装包到 Linux 系统下
(3)解压到指定目录
1 | tar -zxvf apache-zookeeper-3.5.7-bin.tar.gz -C /opt/module/ |
(4)修改名称
1 | mv apache-zookeeper-3.5.7 -bin/zookeeper-3.5.7 |
2、配置修改
(1)将/opt/module/zookeeper-3.5.7/conf 这个路径下的 zoo_sample.cfg 修改为 zoo.cfg;
1 | mv zoo_sample.cfg zoo.cfg |
(2)打开 zoo.cfg 文件,修改 dataDir 路径:
1 | vim zoo.cfg |
修改如下内容:
1 | dataDir=/opt/module/zookeeper-3.5.7/zkData |
(3)在/opt/module/zookeeper-3.5.7/这个目录上创建 zkData 文件夹
1 | mkdir zkData |
3、操作ZK
(1)启动 Zookeeper
1 | bin/zkServer.sh start |
(2)查看进程是否启动
1 | jps |
(3)查看状态
1 | bin/zkServer.sh status |
(4)启动客户端
1 | bin/zkCli.sh |
(5)退出客户端:
1 | quit |
(6)停止 Zookeeper
1 | bin/zkServer.sh stop |
配置参数解读
Zookeeper中的配置文件zoo.cfg中参数含义解读如下:
1 )tickTime = 2000:通信心跳 时间,Zookeeper 服务器 与 客户端 心跳时间,单位毫秒
2 )initLimit = 10 :LF初始通信时限
3 )syncLimit = 5 :LF 同步通信时限
Leader和Follower之间通信时间如果超过syncLimit * tickTime,Leader认为Follwer死掉,从服务器列表中删除Follwer。
4 )dataDir :保存Zookeeper中的数据
注意:默认的tmp目录,容易被Linux系统定期删除,所以一般不用默认的tmp目录
5 )clientPort = 2181 :客户端连接端口,通常不做修改。
ZK集群
集群操作
集群安装
1) 集群 规划
在 hadoop102、hadoop103 和 hadoop104 三个节点上都部署 Zookeeper。
思考:如果是 10 台服务器,需要部署多少台 Zookeeper ?
2) 解压安装
(1)在 hadoop102 解压 Zookeeper 安装包到/opt/module/目录下
(2)修改 apache-zookeeper-3.5.7-bin 名称为 zookeeper-3.5.7
















