【Nowcoder牛客刷题记录】——Python数据分析(二)
【摘要】 目录五、数据清洗DA24 去掉信息不全的用户DA25 修补缺失的用户数据DA26 解决牛客网用户重复的数据DA27 统一最后刷题日期的格式六、Json处理DA28 将用户的json文件转换为表格形式七、分组聚合DA29 牛客网的每日练题量DA30 牛客网用户练习的平均次日留存率DA31 牛客网每日正确与错误的答题次数DA32 牛客网答题正误总数DA33 牛客网连续练习题目3天及以上的用户D...
目录
五、数据清洗
DA24 去掉信息不全的用户
dropna()用法:
DataFrme.dropna(axis=0,how=’any’,thresh=None,subset=None,inplace=False)
参数:
axis: 默认axis=0。0为按行删除,1为按列删除
how: 默认 ‘any’。 ‘any’指带缺失值的所有行/列; 'all’指清除一整行/列都是缺失值的行/列
thresh: int,保留含有int个非nan值的行
subset: 删除特定列中包含缺失值的行或列
inplace: 默认False,即筛选后的数据存为副本,True表示直接在原数据上更改。
DA25 修补缺失的用户数据
DA26 解决牛客网用户重复的数据
DA27 统一最后刷题日期的格式
六、Json处理
DA28 将用户的json文件转换为表格形式
现有一个Nowcoder.json文件,它记录了牛客网的部分用户数据,包含如下字段(字段与字段之间以逗号间隔):
Nowcoder_ID:用户ID
Level:等级
Achievement_value:成就值
Graduate_year:毕业年份
Language:常用语言
如果你读入了这个json文件,能将其转换为pandas的DataFrame格式吗?
七、分组聚合
DA29 牛客网的每日练题量
DA30 牛客网用户练习的平均次日留存率
这题有点难 没看懂
DA31 牛客网每日正确与错误的答题次数
现有牛客网12月每天练习题目的数据集nowcoder.csv。包含如下字段(字段之间用逗号分隔):
- user_id:用户id
- question_id:问题编号
- result:运行结果
- date:练习日期
请你统计2021年12月答题结果正确和错误的前提下每天的答题次数。
DA32 牛客网答题正误总数
DA33 牛客网连续练习题目3天及以上的用户
这题有点难:
大佬的解答,虽然没通过,但是非常细。
DA34 牛客网不同毕业年份的大佬
easy
DA35 不同等级用户语言使用情况
easy
DA36 总人数超过5的等级
八、合并
DA37 统计运动会项目报名人数
DA38 统计运动会项目报名人数(二)
DA39 多报名表的运动项目人数统计
DA40 统计职能部分运动会某项目的报名信息
DA41 运动会各项目报名透视表
请你输出报名的各个项目情况(不包含没人报名的项目)对应的透视表。
DA42 合并用户信息表与用户活跃表
DA43 两份用户信息表格中的查找
九、排序
DA44 某店铺消费最多的前三名用户
DA45 按照等级递增序查看牛客网用户信息
十、函数
DA46 某店铺用户消费特征评分
DA47 筛选某店铺最有价值用户中消费最多前5名
【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)