百度大脑开放日互联网内容安全专场

标签:无 717人阅读 评论(0)

5月15日百度大脑开放日互联网内容安全专场分享了百度在内容安全方面的成果。

 

现在随着法规愈加健全,以及净网,护苗等行动,线上对网络的一些多媒体的内容进行管控。还有更加完善的管理规范,包括儿童个人信息网络保护规定,网络信息内容生态治理规定等等,这些规定的出台,让大家认识到,内容安全已经成为企业越来越需要关心的一块内容。


截屏2020-05-21 下午4.03.03.png


在解决内容安全问题的时候,会遇到什么样的问题或者面临的挑战是什么?

 

第一是人工审核的成本非常高,效率相对来比较低下。在人工在判断的时候主观性会比较差一些。

第二是,监管和业务和规则更新非常快。

第三是,需要审核的时候,要搭建一个人机协同审核系统,系统技术难度很高,成本很高,周期很长。


截屏2020-05-21 下午4.01.18.png

 

面对这些挑战,第一,需要一个足够精准的自动化审核的能力,提升审核效率。

第二,需要一个能全面覆盖,灵活适配多种审核规则的方案,来满足越来越细化的审核的规范要求。

第三,需要提升机器和人工审核的协同效率,百度希望利用AI审核能力帮助企业进行高效低成本的审核。

 

对于内容风险管控,实现的路径拆分成两块,第一是基于百度大脑全面的AI技术,提供最领先的AI审核能力。第二个是凭借广泛的业务经验,开放基于最佳实践的人机协同审核管理系统。

 

基于这两个的路径提供的解决方案,首先提供了非常全面的审核能力,比如有超过14项的图像审核能力,超过八项的文本审核能力,超过九项的语音审核能力。基于这些核心能力,在业务层上打造了两个平台,第一个是百度内容审核平台,第二个是人机协同审核管理平台。

 

截屏2020-05-21 下午4.00.47.png


百度内容审核平台提供全面的审核能力,灵活的规则配置和精准的审核模型。

 

图像提供了超过14项的图像审核能力,包括色情识别,暴恐识别,政治敏感广告,恶心,低俗,公众人物等等这些的识别能力,通过AI图像识别技术,帮助客户来快速的对图像里面是否包含这些违规内容进行审核。


截屏2020-05-21 下午4.01.13.png


超过八项的文本审核能力,当用户输入一些用户评论,注册信息,文章内容,视频弹幕等等到系统中,首先会过一个预制的违禁词库,里面包含两块,一是积累多年的风险处置经验,二是结合监管要求实时更新的一些审核规则。除此以外,第二块会过用户自定义的文本的黑白名单,那如果这些都没有命中,就去过文本审核模型。其中包括色情,暴恐,违禁,政治敏感,恶意推广,违反新广告法,低俗辱骂和低质灌水。


截屏2020-05-21 下午4.01.07.png

 

超过九项的语音审核能力。当一个音频文件过来,会把音频文件同时过两套审核逻辑,第一套审核逻辑首先会把语音的内容转化成文字文本,然后过的文本审核。第二块是因为还有一部分的音频内容,可能是一些没有办法转化成文本信息的音频。比如娇喘声识别,枪击声识别等等。有对应的声学审核模型做审核,最终把两块审核逻辑的内容一起返回,作为最终是封禁,还是需要人工复审,还是直接放过等操作的参考。


截屏2020-05-21 下午4.01.01.png

 

除了官方预置的能力以外,也提供了一个模型自训练平台,如果客户有一些想要去实现过滤的内容。比如对一些物体或场景或声音进行过滤,都可以进行模型训练。如果要训练一个图像分类的模型,每个分类只要几十张图片;如果训练一个声音分类的数据,那只要数十段数秒的音频数据,就能完成一个模型的训练。整个过程对数据的依赖非常低,训练过程可以快至十分钟。


截屏2020-05-21 下午4.00.56.png

 

提供了审核维度,审核标签,审核松紧度,自定义库以及审核策略自动调度的这些功能。策略的调整是相对来说比较自动化的一个过程,自动调度就提供了这样的功能,有三块内容,第一是策略生效状态,第二是策略的生效时间,第三是策略的优先级。


同时还要需要一套功能更加完备的审核系统提升审核管理效率,比如因为业务增长非常快,需要在现有人力的基础上完成更多的审核任务,提升审核人员的效率,不要给审核员增加很多的工作量,让他们保持跟之前一样的审核强度,或者希望他们能更轻松。基于这样的诉求推出了百度人机协同审核管理平台,期望利用高效的人机协同省和流程,易用的操作界面,进一步提升审核效率,同时省去平台开发成本。基于百度云弹性扩展的机器资源,可以这个满足高峰期业务的一些审核需求。


截屏2020-05-21 下午4.01.27.png


提供一个非常高效的审核流程,设置合理的一审,二审,三审的流转逻辑,以及通过区分一些审核组别,进一步提升审核效率。


截屏2020-05-21 下午4.01.51.png

 

基于百度的内容安全平台,国信聚安进行了实际部署使用。


截屏2020-05-21 下午4.01.32.png



视频地址 https://www.bilibili.com/s/video/BV1kT4y1u71y

查看评论

暂无评论

发表评论
  • 评论内容:
      
首页
团队介绍
发展历史
组织结构
MESA大事记
新闻中心
通知
组内动态
科研成果
专利
论文
项目
获奖
软著
人才培养
MESA毕业生
MESA在读生
MESA员工
招贤纳士
走进MESA
学长分享
招聘通知
招生宣传
知识库
文章
地址:北京市朝阳区华严北里甲22号楼五层 | 邮编:100029
邮箱:nelist@iie.ac.cn
京ICP备15019404号-1