- master
-
regionserver
-
HLog
-
更新的操作记录
- 1.0.x版本之前存储在region上
- blockcache
-
region
-
store
- 相对应的一个CF(列簇)
-
结构
- memstore
- 数据写入时的缓存
- storefile...
- storefile
- HFile(存储在hdfs位置的具体文件)
- store...
- region..
- zookeeper
- client
- 自由主题
-
数据结构
-
master
- 为Region server 分配region
- 负责Region server的负载均衡
- 发现失效的Region server并重新分配region
-
regionserver
- 维护master分配的region,处理这些region的io请求
- 负责切分正在运行过程中的变大过大的region
- region
-
特点
- 低延迟反应
- 列式存储,结构稀疏
-
键值模型
-
key
- rowkey
- Column Family(CF)
- Column
-
时间戳
- 版本的联系?
-
value
- Cell
- 版本
-
工具结构
-
强依赖于zookeeper
- kafka,storm同样强依赖
-
zookeeper
- 持有hbase的表的寻址入库
-
监听master、regionserver的运行状态是否宕机以及宕机后的容灾处理
- 保证任何时候集群里只有一个master
- 存储HBase的table元数据