课程纲领 第一周:Hbase系统搭建与摆设,Hbase shell操纵 进修内容: Hbase系统搭建与摆设,Hbase shell操纵; 客户端API操纵,包括put、get、delete方式以及批量处置操纵与客户端缓存,HTable类与Bytes类的利用; 比力过滤器、公用过滤器、附加过滤器、自界说过滤器的利用 计数器的利用,协处置器(coprocessor类、regionobserver类、masterobserver类、endpoint)的利用 HTablePool类的利用 实战:搭建Hbase集群;利用Hbase shell停止表的操纵;操纵Hbase API编写客户端工具操纵Hbase集群 收获内容: 熟练把握Hbase集群的搭建,可以操纵Hbase shell对数据停止操纵与查询; 熟练利用客户端API,领会过滤器、计数器、协处置器以及HTablePool的利用 第二周:客户端API的治理功用、MapReduce系统集成 进修内容: 操纵HbaseAdmin类停止Hbase表的治理,包括表、属性、列的操纵; MapReduce集成,编写Mapreduce法式实现对HBase表的select,多表join,聚合操纵,sort等功用 实战:经过操纵Mapreduce实现数据的查询、聚合、毗连等操纵 收获内容: 把握基于Hbase的Mapreduce法式编写,实现对表的操纵 第三周:HBase系统架构道理 首要先容: Hbase中数据的查找与传输,数据结构B+树、LSM树先容; 数据存储格式HFile格式、KeyValue格式; WAL机制,HLog类、HLogKey类、WALEdit类、LogSyncer类、回放与持久性; region、-root-表的查找; LogEdit的生命周期与内部机制; Coprocessor实现; 二级索引HIndex道理 实战:自界说Coprocessor的实现;HIndex的利用 收获内容: 领会WAL机制 Coprocessor的内部实现 二级索引HIndex的实现道理 第四周:HBase高级用法 首要先容: Hbase表的行键设想,高表与宽表、部分键扫描、分页、时候序列、时候顺序关系; 高级形式; 帮助索引; 搜索集成; 事务; BloomFilter布隆过滤器; 隐式版本控制与自界说版本控制 实战:Hbase表的行健设想 收获内容: Hbase的高级用法,Hbase行健设想的一般方式与各自的特点 第五周:HBase系统集成与案例实战 首要先容: 操纵hbase、Solr和Solr-IndexBuilder,设想与实现一个在线Hbase数据存储与实时查询系统,构建基于Hbase的SQL查询系统 实战:设想与开辟一套数据存储与实时查询系统 收获内容: 从系统设想、开辟、集成的角度,把握Hbase的各项操纵与性能优化计划,构建自己的实时查询系统 |
欢迎光临 IT视频教程资源网 (https://pandasvpn.top/) | Powered by Discuz! X3.2 |