内容纲要
概要描述
当创建索引由于数据量太大问题导致创建失败,本文简单描述了如何分批创建索引操作。
详细说明
交警项目很多地市会出现需要重建索引情况,但是由于数据量太大,创建索引会出现消耗资源太大导致大数据组件异常,重建索引失败等问题,因而需要根据数据量和实际情况进行分批创建索引。如果下面操作过程中出现问题可以直接 联系星环科技全球技术支持中心
1.使用 TDH Manager 访问星环大数据界面,如下图
2.点击进入hyperbase组件,查看regionserver节点
3.使用工具ssh登陆访问任意region server所在服务器,并且kinit安全,根据实际情况分批编写创建索引脚本,执行脚本
# 1.kinit安全
kinit hbase/$(hostname) -kt /etc/hyperbase1/hbase.keytab
#2.创建脚本
vim hphm_dt2.sh
rebuild_global_index_with_range 'CLD_TFC_PASS','HPHM_DT2','1310001000062016-08','13100010000242017-08'
- 图中示例rowkey为红框所标,实际rowkey根据实际情况需要去master页面看CLD_TFC_PASS的rowkey,然后划分,startkey和endkey没有直接”代替)
# 3.执行脚本
nohup cat hphm_dt2.sh | hbase shell &> rebuild.log &
- 备注:
创建完成后如果日志有报错,请按照文档继续下面操作
-(下图中报错可以重新细分rowkey,重建索引)
- (下图中报错则需要手动将数据bulkload)
- 手动bulkload数据如下图
-(第一个是路径,第二个是索引表名称,路径可以去创建任务开始的地方查看,如图)