HBase总结

小明 2025-05-05 06:57:21 4

()
  • 基���介绍
    • 特点(高可靠、高性能、面向列、可伸缩)
      • 非关系型数据库
      • 大数据实时处理
        • 表规模达数十亿行及数百万列
        • 读、写访问可实时
      • 分布式存储系统
        • HDFS(Hadoop Distributed File System)文件存储
        • ZooKeeper作为协同服务
      • 列存储
        • 优点:有利于单列数据查询
        • 缺点:整行读取时效率较慢,需要多次IO操作
    • 与RDB(关系型数据库区别)
      • 索引
        • 多个索引(联合索引)
        • 行键(HBase)
      • 数据维护
        • 当前值替换原值
        • 新增-版本号(HBase)
      • 可伸缩性
        • 集群、分片、分库分表
        • 增加HRigionServer节点(HBase)
    • 使用场景
      • 场景分析
        • 海量数据(TB、PB)
        • 不需要事务特性处理(ACID)
        • 高吞吐量
        • 在海量数据中实现随机读取
        • 需要很好伸缩能力
        • 需要同时处理结构化和非结构化的数据
()
The End
微信