2月20日,今日头条方面宣布了“灵犬”全面升级的消息。除了反色情低俗,新版“灵犬”还加入了反暴力谩骂和反标题党能力。

至此,“灵犬”的检测服务,已覆盖了主要的低俗低质内容类型。

据刺猬公社(ID:ciweigongshe)了解,这是上线近一年后,“灵犬”迎来的首个重大更新版本。数据显示,截至目前,“灵犬”使用人次已经突破240万。这也是国内首款反低俗信息小程序。

检测内容健康程度

这款小程序脱胎于今日头条反低俗算法模型,用于鉴定低俗信息。用户将文字或者文章链接放置到搜索框内,即可查询该条信息的健康程度。

据了解,“灵犬”这类技术模型,不仅可以为普通网民所用,用以净化网络空间,同时也有助于平台内容创作者的内容改进。

不同于一般平台对低俗低质内容通常采取人工投诉、事后删除的办法,“灵犬”作为技术手段,能够有效帮助平台将内容质量检测的机制前置,帮助创作者自查内容是否触发色情低俗、暴力谩骂和标题党等因素。

不过,在文字检测上,“灵犬”团队规定,用户输入的字数必须超过10个字才能进行检测。

对此,“灵犬”团队给出了解释:用户给的上下文、语境等信息越充分,机器判断的准确度就会越高。

在2018年3月份,刺猬公社曾参与过“灵犬”的内测,在“灵犬”上检测了“你饿不饿我下面给你吃”几个字,数据显示,该内容健康指数为51%,不及格。

2019年2月20日,刺猬公社再次检测,该内容的健康概率指数为19%,命中反色情低俗模型,“不应获得算法推荐”。

这是什么意思呢?

“灵犬”就像一个内容审核系统,这个系统集纳了被评定为色情低俗内容的所有关键词,一旦“你饿不饿我下面给你吃”触碰到关键词,该内容将会被提取、分词和语义识别,然后根据设定的规则,输出对应的分数、评级和结论。

中国传媒大学网络法与知识产权研究中心主任王四新教授说,在网络上如果色情低俗内容不被过滤,很容易被当做“产业”进行开发,有商业资本助推,有利可图,在某些国家允许,但在我国不允许,《刑法》对涉及制作、复制、出版、贩卖、传播淫秽物品有明确罪项规定。

他还介绍说,在我国,传播淫秽色情内容,被依法处置的情况很多。此外,还有虚假宣传、谣言……的传播者也会被进行处罚。

但处理低俗信息依旧有难度,“灵犬”团队曾称,不同于色情信息,处理低俗信息的一个难点在于,人们对于低俗的判断标准具有一定的主观性;色情信息很直接,低俗信息偏隐晦,对于像“灵犬”这种机器就更难了。

今日头条的做法是,把低俗的标准分为两个层次:几乎所有人看来都会一致同意的标准底线,和因人而异的主观判断。有些检测标题,因人而异,仁者见仁智者见智。

不过,今日头条方面也称,“灵犬”新版本发布的背后,伴随着“灵犬”打击低俗低质能力的提升。反色情低俗、反暴力谩骂模型,整体识别准确率约为85%,反标题党模型识别准确率约为90%。这些技术模型每天仍在持续优化迭代。

国内外都在治理低俗低质内容

近年来,互联网新闻信息、互联网音频、网络直播等互联网文化内容领域,都成了监管部门的重点关注目标,监管部门也出台了不少的监管政策,以规范行业行为。

去年10月,“傅首尔”“紫竹张先生”“有束光”“万能福利吧”“野史秘闻”“深夜视频”“唐纳德说”等9800多个自媒体账号被全网处置。这源于国家网信办会同有关部门,针对自媒体账号存在的一系列乱象问题,开展的集中清理整治专项行动。

在这次网信办的通报中,主要在以下5个方面出了问题,这5大问题也足以值得自媒体人深度警惕:

1、有的传播政治有害信息,恶意篡改党史国史、诋毁英雄人物、抹黑国家形象;

2、有的制造谣言,传播虚假信息,充当“标题党”,以谣获利、以假吸睛,扰乱正常社会秩序;

3、有的肆意传播低俗色情信息,违背公序良俗,挑战道德底线,损害广大青少年健康成长;

4、有的利用手中掌握大量自媒体账号恶意营销,大搞“黑公关”,敲诈勒索,侵害正常企业或个人合法权益,挑战法律底线;

5、有的肆意抄袭侵权,大肆洗稿圈粉,构建虚假流量,破坏正常的传播秩序。

在此基础上,国家网信办又依法约谈了腾讯微信、新浪微博等自媒体平台,对其主体责任缺失,疏于管理,放任野蛮生长,造成种种乱象,提出严重警告。腾讯微信、新浪微博相关负责人表示将认真接受群众和舆论监督,自查自纠,积极整改,严格管理。

随后,微博发布公告,表示将认真接受群众和舆论监督,自查自纠,积极整改,严格管理。微信平台则发文回应称,将加强对政治有害信息、色情低俗、谣言、标题党、抄袭侵权等违规内容的打击和清理,为用户提供一个更健康的阅读空间。

国家网信办有关负责人指出,自媒体绝不是法外之地。近年来,国家网信办依据《网络安全法》相继出台《互联网新闻信息服务管理规定》《互联网用户公众账号信息服务管理规定》等法规性文件,对具有媒体属性和可对公众发布信息的账号及平台作了明确规定。从趋势上看,自媒体管理已经纳入法治化、规范化、制度化轨道。

而今日头条在去年7月和10月,通过自查、用户举报等方式,处罚了近万个违规账号。

今日头条发布公告称,因侵犯版权而受到平台处罚的头条号账号,主要包括搬运、篡改和歪曲等行为:一是未经许可转载、摘编整合或歪曲篡改新闻作品;二是通过“洗稿”方式抄袭剽窃、篡改删减原创作品;三是未经授权复制、表演、通过网络传播他人影视、音乐、摄影、文字等作品,或以合理使用为名对他人作品删减改编。

由此可见,治理低俗低质内容不仅仅是一个平台的事情,而是整个行业的事情。放眼世界,Facebook也因为低俗低质内容而头疼,去年10月份,Facebook直接对发布低俗低质的账号动刀,一下子删除了该平台上559个页面和251个违反垃圾消息规则的帐号。这些网页和帐号使用假帐号来获取点赞和共享,并引诱用户点击欺骗性网站链接,后者大多涉及政治内容。

Twitter也对该同类型内容进行技术提示,Twitter在消息中的链接中添加“可能敏感”标签。据美国科技博客Gizmodo报道,Twitter的媒体政策显示,该公司将“移除有可能被认为是敏感的内容,例如裸露、暴力。”

据新浪科技报道称,业内人士认为,Twitter早就应该推出这项功能,帮助家长控制儿童所看到的内容,以免他们点击不适当的链接。

据王四新介绍,国外社交媒体对低俗低质内容的整治也在不断加强,即便西方国家有制度安排等原因在言论面前做支撑,但近十年来,仇恨、种族、暴力等问题越来越突出,相关言论也在社交媒体上散播,他们需要对其进行治理。

“这种方法在未来肯定会大行其道”

2018年11月,今日头条CEO陈林在生机大会上表示,在鼓励优质内容、打击低质内容已经成为全球内容平台的共同议题时,今日头条将开放技术模型,和行业一起提高平台生态标准。开放给社会公众,也是希望能通过开放平台技术,促进全行业发展。“灵犬”此次全面升级,无疑验证了这一点。

据了解,目前,今日头条在平台内容治理方面,除了配备“灵犬”,还有其他反色情、反标题党、反虚假信息、反低质内容等数百个技术模型。与此同时,今日头条投入了上万人专业审核编辑团队,致力于结合人工、技术手段,保障平台内容健康。

面对低俗低质内容,整个社会都在出谋划策。2018年10月31日,《经济日报》发表新闻评论建议,要靠技术来提升低俗内容的识别效率。互联网企业要善用包括大数据、人工智能等新技术,与时俱进地更新内容判定标准,细化审核标准,并升级群发检测算法。只有依靠技术不断完善“游戏规则”,才能让违规内容难以“钻空子”,同时更充分地在版权上保护原创内容,也能防范低俗账号以微博、微信等平台为跳板,将用户导向外部空间再提供违规内容。

这个建议正在被像今日头条这样的互联万公司实践。财经国家周刊编委、新媒体资深从业者王新一评价说,今日头条的slogan是“信息创造价值”,而灵犬则是通过检测出有害的信息来创造价值。内容平台需要两手抓,一方面促进平台产生更多优质信息,一方面尽量减少低俗低质内容的出现。

“企业主动利用这种技术手段来做好内容审核工作是一个不错的方法。”王四新说,其他互联网公司也在利用大数据技术做安全审查工作,比如滴滴用技术防御乘客可能遇到的乘车危险。

而知乎在这方面也有实践。据36氪报道,在2016年,知乎上线了机器人瓦力。瓦力的任务,是识别并处理那些不友善、辱骂、阴阳怪气、答非所问、色情内容以及知乎不鼓励的用户爆照。

这种趋势在近两年逐渐明显了起来,越来越多的企业主动或被动去探讨更灵活、更及时、更有效的技术模型,人工成本会降低。王四新预测,“这种方法在未来肯定会大行其道”。

对行业和社会来说,是好事。 (来源:刺猬公社 | 石灿)