参加《21天晋级大数据实战营》——DAY17轻松探索数据背后的价值 - 数据湖探索实验小结

举报
richblue88 发表于 2018/12/15 10:28:05 2018/12/15
【摘要】 1、测试数据下载http://obs-salepredict.obs.cn-north-1.myhwclouds.com/index.html点击chicago.csv下载原始数据。2、obs对象存储-桶创建----待续

1、测试数据下载

http://obs-salepredict.obs.cn-north-1.myhwclouds.com/index.html
点击chicago.csv下载原始数据。

2、obs对象存储

图片.png


图片.png

3、桶创建

图片.png

图片.png


图片.png


4、上传数据

图片.png

图片.png

图片.png

图片.png

图片.png

图片.png

图片.png

5、DLI

图片.png

图片.png

图片.png

6、队列

图片.png

图片.png

图片.png

图片.png

7、创建数据库

图片.png

图片.png

图片.png

图片.png

8、创建OBS表

图片.png

CREATE TABLE chicago(
  room_id long,
  survey_id int,
  host_id long,
  room_type string,
  country string,
  city string,
  borough string,
  neighborhood string,
  reviews int,
  verall_satisfaction float,
  accommodates int,
  bedrooms float,
  bathrooms string,
  price float,
  minstay string,
  last_modified string,
  latitude double,
  longitude double,
  location string
) USING csv OPTIONS (path "s3a://dli-demo-richblue88/")


图片.png




9、SQL编辑与查询


select
  case when price <= 50 then '1 (<50)' when price > 50
  and price <= 100 then '2 (50-100)' when price > 100
  and price <= 150 then '3 (100-150)' when price > 150
  and price <= 200 then '4 (150-200)' when price > 200
  and price <= 250 then '5 (200-250)' when price > 250
  and price <= 300 then '6 (250-300)' when price > 300
  and price <= 500 then '7 (300-500)' else '8 (>500)' end as price_level,
  count(*) / (
    select
      count(*)
    from
      chicago
  ) as percentage
from
  db1.chicago
group by
  price_level
order by
  price_level


图片.png


图表展示

图片.png



图片.png





【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。