阿里巴巴“绿网”昨日上线 人工智能识别违规信息

27.10.2015  09:12

   浙江在线10月27日讯 (钱江晚报记者陈雷)鉴黄师,这是一个可以激发宅男们无穷想象的工作岗位。不过,钱报之前的报道已经揭示,这份工作虽然听上去“无限诱惑”,但是真面目一点也不激情——海量的色情图片看到想吐,删图删到手软的节奏,一点也不轻松。“鉴黄”这种专业性很强的工作,是不是必须依靠手工劳动,啥时候才能进化到人工智能时代呢?现在,改变来了。

  昨天中午,阿里巴巴宣布“绿网”正式上线。

  这款具备了俗名“黄图打分器”部件的产品到底是什么,是怎么运用大数据和科学道理来工作的,让钱报记者替你先一探究竟。接下去,说不定你也有参加体验的机会。

   人工智能识别违规信息

   黄图识别率99.9%

  昨天中午,网站管理员小王成为绿网的第一批用户,他管理的网站是一个大型知名生活服务类网站,活跃的注册用户达到数百万,BBS论坛里的新帖子更是一大早就开始在网页上一个个往上蹿了。

  打开随身的笔记本电脑,进入网站后台,他已经看到了阿里“绿网”标注的一批提醒网站管理员去人工审核的涉嫌违规信息,其中不少都是些垃圾账户发布的跟主题毫不相关的广告信息、涉黄涉赌涉毒等等。

  “用户太多,违规信息总是防不胜防啊。”小王欣喜地看着后台显示的需要审核的信息清单,告诉钱报记者,“这样太好了,会极大地解放管理员和斑竹(网络用语:版主)的精力和时间,相当于帮我们先看了一遍、审了一遍,还标上了高低不同的分数。”

  小王十指飞舞,熟练地在键盘和触摸板之间敲击着,很快就把需要审核的网络帖子信息处理完了。该删的,删了;他觉得能“放行”的,就予以通过。

  阿里巴巴安全部相关负责人告诉钱报记者,其实,小王没看到的一些违规更严重的信息,比如可以直接定义为色情图片的,“黄图打分器”已经干脆利落地拦截掉了。

  阿里绿网的技术开发人员颇有信心地表示:通过人工智能技术鉴别黄色图片,准确率高达99.9%以上。

   一批门户网站

   成为首批体验用户

  打个比方,发布黄赌毒违规信息的用户,就像是在网络上贴牛皮癣小广告的游击队,网站管理员们没法预防他们什么时候出来发布什么,只能追着他们删、删、删。

  不少门户网站是阿里绿网的首批体验用户。长期以来,这些大型网站的管理员们极为头痛的情况之一,就是突然被一些新注册用户,在各种帖子里插广告,发布各种违规信息,严重的还会殃及自己的版块或者整个网站被关停整顿,甚至被警方约谈。

  现在,有了能帮助用户减少审核成本、有效降低涉黄风险的阿里绿网,这一切要轻松多了。“阿里绿网依托于阿里巴巴的全生态体系,拥有海量的特征样本及丰富的数据模型分析经验,基于云计算平台,能对海量数据进行快速检测。”阿里绿网项目相关负责人孝肃表示, “阿里绿网是智能化检测的创新,从被动的帮用户处理违规信息转变为用户主动排查信息,培养了用户管理主动网站内容的习惯。”

  要说清楚的是,“阿里绿网”并不是一个网站,也不是一个让手机下载的APP,它是一个专注内容识别的安全产品。简单地说,这是一个相当于香烟的过滤嘴儿,是网络黄赌毒等违规信息的“过滤器”,是网站“站长”、“版主”、管理员们的得力助手。

   艺术和色情如何区别

   分数越高危险系数越高

  艺术和色情,对于普通人来说,有时候还真的不太好区分。阿里绿网在鉴定黄图方面是怎么来做的呢?“黄图打分器”这个俗名是最形象生动的解释了,给图片打分!从0到100分,打上再说,最后依然是靠“鉴黄师”人工审定。

  对不同内容、尺度的图片进行分值鉴定,分值越高,色情度越高。钱报记者获悉,大家一般能认定的色情图片分值会维持在80分以上,对于知名的油画、雕塑这些艺术作品,会做一定程度的区别对待。

  以断臂维纳斯为例,阿里绿网识别结果是38.27分,这就是一个正常的分数范围。“我们会在样本库里对这些艺术名画进行识别,防止艺术品被卷入色情类目。”相关负责人告诉钱报记者。

  阿里绿网首批面向的是阿里云用户,接下来还将扩大用户覆盖面。

(本文来源:     责任编辑:吴红梅)