GitHub上20多万张不可描述图片的数据集

举报
不脱发的程序猿 发表于 2020/12/31 23:36:14 2020/12/31
【摘要】 江湖一直有传闻:三流程序员写UI,二流程序员写框架,一流程序员写算法,顶级程序员穿女装。 现如今头发的稀疏程度也绝不再是判断对方是否一个高级程序员的标志,因为年纪轻轻秃头已经成为了一个不争气的现实。在头发上没什么好聊的,代码也没什么好比,那么咱们就来比比女装。 一说起女装,江湖中各位程序员大佬纷纷报道前来,约在武当山「GitHub」一战高下。这一战有一个不成熟的约定:只有...

江湖一直有传闻:三流程序员写UI,二流程序员写框架,一流程序员写算法,顶级程序员穿女装。

现如今头发的稀疏程度也绝不再是判断对方是否一个高级程序员的标志,因为年纪轻轻秃头已经成为了一个不争气的现实。在头发上没什么好聊的,代码也没什么好比,那么咱们就来比比女装。

一说起女装,江湖中各位程序员大佬纷纷报道前来,约在武当山「GitHub」一战高下。这一战有一个不成熟的约定:只有男孩子程序员才能在这里上传自己的照片,而且一定要是女装照片。

 这个GitHub项目可谓是集齐了各种各样的女装大佬,7000+的star让这个项目充满了基情。从项目中随便抽出几张女装大佬的照片就是下面这样子的:

 

上面这个项目都是女装大佬,披着女装的男孩。下面再说的这个项目可就是真女装了。这个项目名字叫做nsfw_data_scrapper,它是一个图集项目,是一个包含20多万张不可描述图片的数据集。

这些图片是一个叫做Alexander Kim的数据科学家采集了众多色情网站的图片数据编织而成的。可谓是相当有良心的科学家了。

项目中的二十多万张图片总共分为了五大类别:

这个项目的用途其实倒是挺多的,比方说用来识别色情照片,用来识别视频中的色情片段做敏感内容过滤。或者是用来训练图像分类器。建议大家把这个项目给下载下来自己练练手。

GitHub网址:https://github.com/komeiji-satori/Dress

文章来源: handsome-man.blog.csdn.net,作者:不脱发的程序猿,版权归原作者所有,如需转载,请联系作者。

原文链接:handsome-man.blog.csdn.net/article/details/86737767

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。