hive建表4

举报
没头脑 发表于 2022/06/18 08:22:35 2022/06/18
【摘要】 任务1:相似度检测 查询result表中,碱基对(aliLen)长度介于29800-29900之间的个数,截图并保存为3-1-alilen。查询result表中,按照匹配程度(identity)进行降序排序,显示sav,identity,bitScore这三个字段的前十行数据,截图并保存为3-2-bitscore。 任务2:分组统计 分组统计result表中 gapOpens 的次数并进行降...

任务1:相似度检测 查询result表中,碱基对(aliLen)长度介于29800-29900之间的个数,截图并保存为3-1-alilen。查询result表中,按照匹配程度(identity)进行降序排序,显示sav,identity,bitScore这三个字段的前十行数据,截图并保存为3-2-bitscore。 任务2:分组统计 分组统计result表中 gapOpens 的次数并进行降序排序,显示字段包含gapOpens及对应的次数( gapNum),显示前5行数据,截图并保存为3-3-top5。

select * from result where aliLen between 29800 and 29900
select count(*) from result as gapNum group by gapOpens order by gapNum desc limit 5
​

查询result表中,统计qstart=sstart 且 qend=send的数据个数以及qstart!=sstart或qend!=send的数据个数,截图并保存结果为3-4-start。 查询结果输出形式如下:

equal num
yes ***
no ***
select yes as equal ,count(1) as num from result where qstart=sstart and qend=send union all
select no as equal ,count(1) as num  from result where qstart!=sstart or qend!=send
​

查询result 表中,分组统计匹配度在0%-60%,60%-70%,70%-80%,80%-90%,90%-100%,并按照等级个数进行升序排序,其中0%-60%为E等级,60%-70%为D等级,70%-80%为C等级,80%-90%为B等级,90%-100%为A等级,截图并保存为3-5-group。 查询结果输出形式如下(以下根据实际情况显示):

identity total
A **
B **
C **
D **
E **
select identity,count(1) as total  from (
​
select  case when total>=90 and total<100 then ‘A’
when total>=80 and total<90 then ‘B’
when total>=70 and total<80 then ‘C’
when total>=60 and total<90 then ‘D’
else ‘E’
end as identity from result )
group by identity ,order by identity
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。