乱读天书, 不求甚解
周祎骏的个人云笔记
Toggle navigation
乱读天书, 不求甚解
主页
Linux:系统配置
Linux:用户管理
Linux:优化排错
Linux:进程调度
Linux:文件系统
Linux:网络
Linux:系统服务
Linux:安全
Linux:内核
容器:Docker
容器:containerd
容器编排:Kubernetes
IAC:Terraform
大数据:Hadoop
大数据:Zookeeper
大数据:Hbase
消息队列:rsyslog
消息队列:kafka
数据库:MySQL
数据库:MongoDB
搜索引擎:Elasticsearch
时序数据库:OpenTSDB
网站服务:Nginx
编程:Bash
编程:Perl
编程:Python
编程:C
编程:JAVA
编程:Rust
版本控制:gitlab
知识管理:docusaurus
常用小工具
关于我
标签
Hbase 0.0 介绍
2017-08-20 12:56:30
76
0
0
admin
> Hbase是一个数据库,因为是Hadoop 生态圈的一员,故此放在大数据类别里 #大致介绍 开源,官网:http://hbase.apache.org/ 集群依赖于hdfs, 单点可以不用hdfs hbase的数据没有类型,全部都是字符串 Hbase 是一个面向列的表,每一个数据块保存一个列。整张表可以简单理解成一个大hash,因此随着数据量的增长,查询的复杂度仍然是O(1)的 ``` {主键1:{列名:值},...} ``` 其中主键会被按照字节的字典顺序排序 *** ##一些概念 **RowKey:**相当于数据的主键 **列,列族:**列族是列的集合,同一个列族的列的数据会被存储在一起,因此建议关系相近的列(经常会一起被搜索)应当被放在一个列族里。 **Timestamp:** Hbase 可以管理数据的版本  如果搜索T1时间Row1的数据,得到{A1:1,A2:2,B1:3,B4:4} 如果搜索T2(最新)时间Row1的数据,得到{A1:1,A2:2,B1:3,B4:5} *** ##物理模型 一张表会被分成多个Region(分片),一个Region 包含多个存储,每个存储保存一个列族。 *** ##架构 **Master Server:**负责负载均衡,拆分Region,还有一些建表类似的工作。 **Region Server:**存储数据,提供数据服务。 **Zookeeper:**协助Master。 ****
上一篇:
Elasticsearch 4.0 安全
下一篇:
Hbase 1.0 搭建Hbase(0.96)
文档导航