hive建表4
【摘要】 任务1:相似度检测 查询result表中,碱基对(aliLen)长度介于29800-29900之间的个数,截图并保存为3-1-alilen。查询result表中,按照匹配程度(identity)进行降序排序,显示sav,identity,bitScore这三个字段的前十行数据,截图并保存为3-2-bitscore。 任务2:分组统计 分组统计result表中 gapOpens 的次数并进行降...
任务1:相似度检测 查询result表中,碱基对(aliLen)长度介于29800-29900之间的个数,截图并保存为3-1-alilen。查询result表中,按照匹配程度(identity)进行降序排序,显示sav,identity,bitScore这三个字段的前十行数据,截图并保存为3-2-bitscore。 分组统计result表中 gapOpens 的次数并进行降序排序,显示字段包含gapOpens及对应的次数( gapNum),显示前5行数据,截图并保存为3-3-top5。
select * from result where aliLen between 29800 and 29900
select count(*) from result as gapNum group by gapOpens order by gapNum desc limit 5
查询result表中,统计qstart=sstart 且 qend=send的数据个数以及qstart!=sstart或qend!=send的数据个数,截图并保存结果为3-4-start。 查询结果输出形式如下:
equal | num |
---|---|
yes | *** |
no | *** |
select yes as equal ,count(1) as num from result where qstart=sstart and qend=send union all
select no as equal ,count(1) as num from result where qstart!=sstart or qend!=send
查询result 表中,分组统计匹配度在0%-60%,60%-70%,70%-80%,80%-90%,90%-100%,并按照等级个数进行升序排序,其中0%-60%为E等级,60%-70%为D等级,70%-80%为C等级,80%-90%为B等级,90%-100%为A等级,截图并保存为3-5-group。 查询结果输出形式如下(以下根据实际情况显示):
identity | total |
---|---|
A | ** |
B | ** |
C | ** |
D | ** |
E | ** |
select identity,count(1) as total from (
select case when total>=90 and total<100 then ‘A’
when total>=80 and total<90 then ‘B’
when total>=70 and total<80 then ‘C’
when total>=60 and total<90 then ‘D’
else ‘E’
end as identity from result )
group by identity ,order by identity
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)