实时即未来,车联网项目之phoenix on hbase 即席查询【四】
【摘要】 @[toc] Phoenix的介绍和客户端命令Phoenix的概念Phoenix on HBase 和 Hive on HDFS 的区别Phoenix 客户端命令操作及说明查看表操作① TABLE_SCHEMA② 对应 HBase 的 namespace创建表的操作新增数据查询操作更新操作删除操作 构建HBase的二级索引为什么需要构建二级索引索引的类型①概念:创建:查看:删除:②概念:创建...
@[toc]
Phoenix的介绍和客户端命令
-
Phoenix的概念
-
Phoenix on HBase 和 Hive on HDFS 的区别
-
Phoenix 客户端命令操作及说明
-
查看表操作
① TABLE_SCHEMA
② 对应 HBase 的 namespace
- 创建表的操作
- 新增数据
- 查询操作
- 更新操作
- 删除操作
构建HBase的二级索引
-
为什么需要构建二级索引
-
索引的类型
①
概念:
创建:
查看:
删除:
②
概念:
创建:
查看:
删除:
③
概念:
创建:
查看:
删除:
④
概念:
创建:
查看:
删除:
-
本地索引和全局索引的比较
- 索引的优化
原始数据itcast_src构建二级索引
-
创建 HBase 表对应的 phoenix 表
-
创建 HBase 表对应的 phoenix 视图
phoenix 使用场景
车辆常用字段明细数据 ETL
- 常用字段
- 创建 HBase 车辆指标即席查询表
-
在 ETL 主任务中添加常用字段落地逻辑
-
srcDataStream.addSink(new VehicleDetailSinkOptimizer(“itcastsrc_vehicle_detail”));
-
编写核心业务逻辑 实现 RichSinkFunction
private Put setDataSourcePut(ItcastDataObj itcastDataObj) { //确定rowkey String rowKey = itcastDataObj.getVin() + StringUtil.reverse(itcastDataObj.getTerminalTimeStamp().toString()); Put put = new Put(Bytes.toBytes(rowKey)); //设置需要写入的列有那些 //这两个列一定不为空,如果为空就不是正常数据了 put.addColumn(Bytes.toBytes(cf), Bytes.toBytes("vin"), Bytes.toBytes(itcastDataObj.getVin())); put.addColumn(Bytes.toBytes(cf), Bytes.toBytes("terminalTime"), Bytes.toBytes(itcastDataObj.getTerminalTime())); //电量百分比(currentElectricity)、当前电量(remainPower)、百公里油耗(fuelConsumption100km)、 // 发动机速度(engineSpeed)、车辆速度(vehicleSpeed) if(itcastDataObj.getCurrentElectricity() != -999999D){ put.addColumn(Bytes.toBytes(cf), Bytes.toBytes("currentElectricity"), Bytes.toBytes(itcastDataObj.getCurrentElectricity())); } if(itcastDataObj.getRemainPower() != -999999D){ put.addColumn(Bytes.toBytes(cf), Bytes.toBytes("remainPower"), Bytes.toBytes(itcastDataObj.getRemainPower())); } if(StringUtils.isNotEmpty(itcastDataObj.getFuelConsumption100km()) ){ put.addColumn(Bytes.toBytes(cf), Bytes.toBytes("fuelConsumption100km"), Bytes.toBytes(itcastDataObj.getFuelConsumption100km())); } if(StringUtils.isNotEmpty(itcastDataObj.getEngineSpeed()) ){ put.addColumn(Bytes.toBytes(cf), Bytes.toBytes("engineSpeed"), Bytes.toBytes(itcastDataObj.getEngineSpeed())); } if(itcastDataObj.getVehicleSpeed() != -999999D){ put.addColumn(Bytes.toBytes(cf), Bytes.toBytes("vehicleSpeed"), Bytes.toBytes(itcastDataObj.getVehicleSpeed())); } put.addColumn(Bytes.toBytes(cf), Bytes.toBytes("processTime"), Bytes.toBytes(DateUtil.getCurrentDateTime())); //返回put对象 return put; }
-
-
在 phoenix 中创建车联指标即席查询明细视图
车辆明细数据统计
车辆总数统计
- 统计车辆明细总数
- 统计每天在线的车辆总数
车辆电量统计
- 统计车辆电量百分比
- 统计当前电量
车辆油耗统计
- 统计车辆百公里油耗
车辆速度统计
- 统计车辆发动机速度
- 统计车辆速度vehicleSpeed,求最大、最小、平均车速
车辆数据统计意义分析
Zeppelin简介
- zeppelin应用场景
- zeppelin安装介绍
zeppelin UI介绍
zeppelin整合mysql
zeppelin整合hive
车辆电量、速度数据统计报表
- 车辆电量统计报表
- 车辆速度统计报表
问题
-
如何删除topic并初始化数据
步骤: 1.检查 server.properties 配置文件中 delete.topic.enable=true,三台都要设置重启集群。 2.删除kafka中topic vehicledata [root@node01 kafka]# bin/kafka-topics.sh --zookeeper node01:2181,node02:2181,node03:2181 --delete --topic vehicledata # 使用 kafka-tools 客户端删除topic 3.打开 zkCli.sh 删除三组配置 rmr /brokers/topics/vehicledata rmr /config/topics/vehicledata rmr /admin/delete_topics/vehicledata 4.如果kafka集群没有关闭,关闭kafka集群 5.清空log.dirs=/export/data/kafka/kafka-logs目录就是kafka集群的数据目录 rm -rf /export/data/kafka/kafka-logs/* 6.重启kafka集群 7.创建topic vehicledata [root@node01 kafka]# bin/kafka-topics.sh --zookeeper node01:2181 --create --topic vehicledata --partitions 3 --replication-factor 2
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)