您的位置:首页 > 科技 > IT业 > 那个20多万“不可描述”照片的数据集,有人用它做了鉴黄模型

那个20多万“不可描述”照片的数据集,有人用它做了鉴黄模型

2019-01-25 来源:量子位  浏览:    关键词:量子

近日, GitHub呈现一个名为“NSFW Model”的项目。

浅显一点来说,就是一个鉴黄模型。

这个模型,运用的数据来自前不久量子位引见的那个数据集,内含多20万张“不可描画”图片。

同时,这个模型也被项目的贡献者做成了Demo。

既然有了Demo,那肯定是免不了测试一番……Demo网站十分简单,进去之后能做什么了如指掌。

上传图片之后,是自动给出结果,不需求点击其他按钮。

但有时分不会给出结果…..还有待完善。

结果是数据集中提到的5种类别的可能性。

分别是:hentai、sexy、neutral、drawings、porn。

细致每个类别代表的意义,如下图所示:好了,开端第一个测试:这个图有71%的可能性是hentai;16%的可能性是porn。

你觉得准吗?但下面这个,就有点不好说了。

porn到了76%,19%是hentai。

依照这个规范,《超体》别想正常上映了……但整体上,这个模型还是能工作的,比如整个漫画,就很好的辨认出来了,比如其他的一些,也能辨认出来(但图片就不好放了)。

至于精确率怎样样,没法给出定论。

假如你有兴味,能够去体验下这个Demo。

地址:话说话来,看到这个模型,你有没有想自己上手体验一下?GitHub有相关的开源代码和数据集。

在Demo网站的下方,写了一句爱因斯坦的话:只需两样东西是无限的,就是宇宙,还有人类的愚笨,不过我对前者还没什么把握。

量子位正在招募编辑/记者,工作地点在北京中关村。

等候有才气、有热情的同窗参与我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者'' 追踪AI技术和产品新动态

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:service@qeerd.com,投稿邮箱:tougao@qeerd.com