一日一技:如何对数据进行过滤
【摘要】 批量过滤数据的正确方法
有一个列表[1, 2, False, '', 'test', 0]
,现在需要把里面所有非空、非False,非0的数据取出来。
可能有一些人会使用列表推导式:
a = [1, 2, False, '', 'test', 0]
useful = [x for x in a if x]
但如果过滤规则稍微复杂一些呢?例如,如果列表里面的元素不是字符串,那么先把元素转换为字符串,然后转换为bytes型数据,计算md5值。如果md5值转换成10进制数以后是3的倍数,那么就把这个数筛选出来。
为了实现这个目的,我们可以定义一个函数:
import hashlib
def check(value):
value_str = str(value)
value_hex = str(hashlib.md5(value_str.encode()).hexdigest())
value_decimal = int(value_hex, 16)
return value_decimal % 3 == 0
a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
b = [x for x in a if check(x)]
运行效果如下图所示:
在Python里面,有一个现成的函数filter
也能实现这个效果:
a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
b = filter(check, a)
此时,获得的b变量是一个生成器对象,只有在对它进行迭代的时候,才能获取里面的值。如下图所示:
filter
函数接收两个参数,第一个参数是一个函数名,第二个参数是一个可迭代的对象。filter函数把可迭代对象的每一个值都放进参数1对应的函数中,如果返回True,那么这个值就是有效的,就会被保留。如果返回False,那么这个值就会被丢弃。
Filter的第一个参数也可以是None
,此时filter(None, [1, 2, '', False, 'xx'])
的效果就是把列表里面所有非空,非0,非False的数据返回出来。
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)