HBase的基础介绍
创始人
2024-03-15 20:05:32
0

  HBase的介绍

HBase 是 BigTable 的开源(源码使用 Java 编写)版本。是 Apache Hadoop 的数据库,是建立在 HDFS 之上,被设计用来提供高可靠性、高性能、列存储、可伸缩、多版本的 NoSQL 的分布式数据存储系统,实现对大型数据的实时、随机的读写访问

  • HBase 依赖于 HDFS 做底层的数据存储
  • HBase 依赖于 MapReduce 做数据计算
  • HBase 依赖于 ZooKeeper 做服务协调

HBase表的特点

  • 大:一个表可以有上十亿行,上百万列。
  • 面向列:面向列(族)的存储和权限控制,列(簇)独立检索。
  • 稀疏:主要用来存储结构化和半结构化的松散数据,对于为空的列,并不占用存储空间(底层所有数据的存储都是字节数组)。
  • 无模式:每行都有一个可排序的主键和任意多的列,列可以根据需要动态的增加,同一张表中不同的行可以有截然不同的列

HBase与hive的相同和不同

相同

hbase与hive都是架构在hadoop之上的,都是用HDFS作为底层存储

不同

  • Hive是建立在Hadoop之上为了减少MapReduce jobs编写工作的批处理系统,HBase是为了支持弥补Hadoop对实时操作的缺陷的项目 。总的来说,hive是适用于离线数据的批处理hbase是适用于实时数据的处理
  • Hive本身不存储和计算数据,它完全依赖于HDFS存储数据和MapReduce处理数据,Hive中的表纯逻辑
  • hbase是物理表,不是逻辑表,提供一个超大的内存hash表,搜索引擎通过它来存储索引,方便查询操作
  • 由于HDFS的不可随机读写,hive是不支持随机写操作,而hbase支持随机写入操作
  • HBase只支持简单的键查询,不支持复杂的条件查询

HBase的优缺点

优点

  • 容量巨大:HBase的单表可以支持千亿行、百万列的数据规模,数据容量可以达到TB甚至PB级别。
  • 良好的可扩展性:HBase集群可以非常方便地实现集群容量扩展,主要包括数据存储节点扩展以及读写服务节点扩展。可以通过简单的增加RegionServer节点实现计算层的扩展
  • 稀疏性:HBase支持大量稀疏存储,即允许大量列值为空,并不占用任何存储空间。
  • 多版本:HBase支持多版本特性,即一个 KV 可以同时保留多个版本,用户可以根据需要选择最新版本或者某个历史版本。
  • 支持过期:HBase支持TTL过期特性,用户只需要设置过期时间,超过TTL的数据就会被自动清理,不需要用户写程序手动删除。
  • 高可靠性:WAL预写式日志(write-ahead log)机制保证了数据写入时不会因集群异常而导致写入数据丢失,Replication机制保证了在集群出现严重的问题时,数据不会发生丢失或损坏。而且Hbase底层使用HDFS,HDFS本身也有备份。
  • 高性能:底层的LSM数据结构和Rowkey有序排列等架构上的独特设计,使得Hbase具有非常高的写入性能。region切分,主键索引和缓存机制使得Hbase在海量数据下具备一定的随机读取性能,该性能针对Rowkey的查询能到达到毫秒级别

缺点

  • HBase本身不支持很复杂的聚合运算(如 Join、GroupBy 等)。如果业务中需要使用聚合运算,可以在HBase之上架设Phoenix组件或者Spark 组件,前者主要应用于小规模聚合的 OLTP 场景,后者应用于大规模聚合的 0LAP 场景。
  • HBase本身并没有实现二级索引功能,所以不支持二级索引查找。好在针对 HBase 实现的第三方二级索引方案非常丰富,比如目前比较普遍的使用 Phoenix 提供的二级索引功能。
  • HBase原生不支持全局跨行事务,只支持单行事务模型。同样,可以使用Phoenix提供的全局事务模型组件来弥补HBase的这个缺陷。
  • HBase哪怕只是存储少量数据,它也不会很快。可以说HBase 并不快,只是当数据量很大的时候它慢的不明显

相关内容

热门资讯

大反转!假的!桂林 “扁担女孩... 6月13日灌阳县委宣传部公众号“今日灌阳”发布辟谣信息全文如下↓↓↓近日,有网民发帖称“广西‘扁担女...
打破围墙!10所驻昌平高校共建... 转自:北京日报客户端记者6月15日从未来科学城管委会获悉,北京未来大学科技园近日启动共建。科技园采用...
求一些丫鬟、侍婢、宫女的名字,... 求一些丫鬟、侍婢、宫女的名字,写小说急用,必须是两个字角色名字,你看如果剧情需要只是缺少一个人物用来...
求带有腹黑二字的穿越小说 名字... 求带有腹黑二字的穿越小说 名字 有多少都说出来吧 谢谢了我只记得腹黑小狂后
建设银行千亿科创基金在沪启航 新华财经上海6月15日电 记者获悉,近日,中国建设银行在沪落地千亿科创基金并进行重点项目签约。建设银...
来几首激情的战歌, 不激情的不... 来几首激情的战歌, 不激情的不要。1the dawn2she is my sin3breath an...
伊朗武器工厂遭空袭 李超/央视新闻总台记者从伊朗方面获悉,当地时间15日午间,位于伊朗中部的一处武器工厂遭到以色列空袭。...
倾盆大雨、毫不犹豫、饥肠辘辘、... 倾盆大雨、毫不犹豫、饥肠辘辘、滚瓜烂熟、流光溢彩、津津有味、天长日久、如醉如痴、浮想联翩的意思鸟飞的...
宜家先知、有滴吔一旦错过好似就... 宜家先知、有滴吔一旦错过好似就翻吾倒转头、加埋尼次、又系第几次 有谁知道这是什么意思?(原文)宜家先...
《妖猫传》哪里可以在线观看全集... 《妖猫传》哪里可以在线观看全集?迟点88影院上就能看,这个网站电影和电视剧都更新的很快,基本上是下来...
和女朋友谈了有一周时间,第2天... 和女朋友谈了有一周时间,第2天就同居了,之后每天她不上班,天天和闺蜜腻在一块?都同居了,还能怎么样,...
外资高位清仓杭州银行,累计赚超... 6月9日,杭州银行发布两项关键公告:一是外资股东澳洲联邦银行(CBA)清仓所持股份已完成过户,二是该...
一个人在唱歌是什么成语 一个人在唱歌是什么成语引吭高歌,鬼哭狼嚎
AI海报 | 廊坊经洽会5大特... 转自:河北新闻网2025年中国·廊坊国际经济贸易洽谈会将于6月16日至6月20日召开。逛市集是今年廊...
如何建设新入园幼儿心理的安全感 如何建设新入园幼儿心理的安全感 给幼儿园的老师培训幼儿心理方面的知识等,或者另外请一位专业心理咨询...
海口一免税公司员工“套购”千件... 海口市一免税公司员工许某为牟利,“套购”免税品1627件,还伙同他人利用管理漏洞和职务便利,监守自盗...
全红婵回粤养伤不参加新加坡世锦... 【#全红婵回粤养伤不参加新加坡世锦赛#】6月14日记者获悉,广东跳水队目前已经提前启动夏训,进入最后...
游客在滕王阁拍照遭无人机划伤,... “在滕王阁五楼给妈妈拍照的时候,无人机直接冲我脑袋砸过来。我老公看到之后用手拍开,我和他均被划伤。”...
听到亲人生重病,睡不着 听到亲人生重病,睡不着你好,很正常,亲人生病家人都是难以入眠,你要想想自己得先把自己照顾好才可以去照...
青春的代名词是什么? 青春的代名词是什么?需要形容青春的词语桀骜不驯,年少轻狂,倔强…