Python篇数据分析习题(二)

举报
漫步桔田 发表于 2023/02/16 11:32:34 2023/02/16
【摘要】 Python篇数据分析习题(二)

1.现有一个Nowcoder.csv文件,它记录了牛客网的部分用户数据,包含如下字段(字段与字段之间以逗号间隔):
Nowcoder_ID:用户ID
Level:等级
Achievement_value:成就值
Num_of_exercise:刷题量
Graduate_year:毕业年份
Language:常用语言
如果你想知道哪些人是2020年毕业的,并且最常使用的语言是Java的,请输出他们的全部信息。

import pandas as pd
 
data = pd.read_csv("Nowcoder.csv")
pd.set_option("display.width", 200)
pd.set_option("display.max_rows", None)
pd.set_option("display.max_columns", None)

print(data[(data["Language"] == "Java") & (data["Graduate_year"] == 2020)])

2.现有一个Nowcoder.csv文件,它记录了牛客网的部分用户数据,包含如下字段(字段与字段之间以逗号间隔):
Nowcoder_ID:用户ID
Level:等级
Achievement_value:成就值
Num_of_exercise:刷题量
Graduate_year:毕业年份
Language:常用语言
现在运营同学想要你帮忙统计一下使用CPP、C、C#的用户的全部信息,请你帮他输出一下。

import pandas as pd
 
data = pd.read_csv("Nowcoder.csv", sep=",")
pd.set_option("display.width", 300)  
pd.set_option("display.max_rows", None)  
pd.set_option("display.max_columns", None)
 
print(data[data["Language"].isin(["CPP", "C", "C#"])])

3.现有一个Nowcoder.csv文件,它记录了牛客网的部分用户数据,包含如下字段(字段与字段之间以逗号间隔):
Nowcoder_ID:用户ID
Level:等级
Achievement_value:成就值
Num_of_exercise:刷题量
Graduate_year:毕业年份
Language:常用语言
正在刷题的小白想知道牛客网刷题数量不低于500题的大佬,他们的等级和成就值是怎么样的,你能帮助他吗?

import pandas as pd
 
df = pd.read_csv("Nowcoder.csv", sep=",")
cond = df["Num_of_exercise"] >= 500
 
print(df[cond][["Level", "Achievement_value"]])

4.现有一个Nowcoder.csv文件,它记录了牛客网的部分用户数据,包含如下字段(字段与字段之间以逗号间隔):
Nowcoder_ID:用户ID
Level:等级
Achievement_value:成就值
Num_of_exercise:刷题量
Graduate_year:毕业年份
Language:常用语言
假设2018年毕业的你突发奇想,想要知道牛客网有哪些使用CPP的7级用户,且他们的毕业年份和你不是同年的,请问该怎么筛选?

import pandas as pd
 
Nowcoder = pd.read_csv("Nowcoder.csv", sep=",")
pd.set_option("display.width", 300) 
pd.set_option("display.max_rows", None)
pd.set_option("display.max_columns", None)
 
print(Nowcoder.query("Language=='CPP' & Level==7"))

5.现有一个Nowcoder.csv文件,它记录了牛客网的部分用户数据,包含如下字段(字段与字段之间以逗号间隔):
Nowcoder_ID:用户ID
Level:等级
Achievement_value:成就值
Num_of_exercise:刷题量
Graduate_year:毕业年份
Language:常用语言
刚刚发现牛客网想要学习编程的小白,不知道优先学习什么语言,刷什么题单,你能帮助他从这个csv文件中找到牛客网各种语言使用的用户分别有多少吗?

import pandas as pd
 
data=pd.read_csv('Nowcoder.csv',sep=',')
 
print(data['Language'].value_counts())

6.现有一个Nowcoder.csv文件,它记录了牛客网的部分用户数据,包含如下字段(字段与字段之间以逗号间隔):
Nowcoder_ID:用户ID
Level:等级
Achievement_value:成就值
Num_of_exercise:刷题量
Graduate_year:毕业年份
Language:常用语言
Continuous_check_in_days:最近连续签到天数
Number_of_submissions:提交题目数量
Last_submission_time:最后一次提交题目日期
运营同学想要统计牛客网的用户的最近的连续签到情况,他想知道最长的用户已经连续签到了多久,最短的用户又连续签到了多久,请帮他输出一下。

import pandas as pd
 
Nowcoder = pd.read_csv("Nowcoder.csv", sep=",")
 
print(Nowcoder["Continuous_check_in_days"].max())
print(Nowcoder["Continuous_check_in_days"].min())

7.现有一个Nowcoder.csv文件,它记录了牛客网的部分用户数据,包含如下字段(字段与字段之间以逗号间隔):
Nowcoder_ID:用户ID
Level:等级
Achievement_value:成就值
Num_of_exercise:刷题量
Graduate_year:毕业年份
Language:常用语言
Continuous_check_in_days:最近连续签到天数
Number_of_submissions:提交代码次数
Last_submission_time:最后一次提交题目日期
打算学习Python的小白同学打开了牛客网,他想知道Python到底难不难,于是他想从牛客网Python用户都平均提交了多少次代码来认识,请你帮他找一找。

import pandas as pd
 
data = pd.read_csv("Nowcoder.csv", sep=",")
 
print(round(data[data["Language"] == "Python"]["Number_of_submissions"].mean(), 1))

8.现有一个Nowcoder.csv文件,它记录了牛客网的部分用户数据,包含如下字段(字段与字段之间以逗号间隔):
Nowcoder_ID:用户ID
Level:等级
Achievement_value:成就值
Num_of_exercise:刷题量
Graduate_year:毕业年份
Language:常用语言
Continuous_check_in_days:最近连续签到天数
Number_of_submissions:提交代码次数
Last_submission_time:最后一次提交题目日期
牛客网运营同学有一个活动,需要统计所有用户等级的中位数,但为去掉一些非常不活跃的账号,于是他们只统计刷题数量不低于10题的那部分用户。

import pandas as pd
 
Nowcoder = pd.read_csv("Nowcoder.csv", sep=",")
data = Nowcoder[Nowcoder["Num_of_exercise"] >= 10]
a = data["Level"].median()
 
print(a.astype("int"))
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。