热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

UGC产品下架频发,企业该如何走出内容审核的困局

 某国民种草APP由于涉及内容违规,从安卓应用市场消失了,应该算是最近最火的话题。作为C2C的种草平台,该APP不仅允许用户线上分享种草清单,还可以发布购买链接,让消费者接受安利的同时可以直接购买商品

 

某国民种草APP由于涉及内容违规,从安卓应用市场消失了,应该算是最近最火的话题。

作为C2C的种草平台,该APP不仅允许用户线上分享种草清单,还可以发布购买链接,让消费者接受安利的同时可以直接购买商品。二者相结合,就成了完美的导流神器。

其实平台本身只是一个单纯的内容分享社区,所有人都可以来发布任何内容,像半佛仙人文章里提到的一样,对于一起C2C的UGC平台来说,只要是能够发布内容的地方,内容失控的风险都是存在的。评论区、用户昵称、私信区、论坛…..都可能被不法分子利用成为其发布违禁商品、色情引流、博彩诈骗等,从而导致平台内容的失控。

图为:违规信息

内容失控的问题其实也是属于反欺诈风控的一部分,所以本篇文章会从两个方面出发,谈谈企业进行内容治理的现状:一是黑灰产如何利用UGC类平台进行发布违规信息,并进行引流诈骗;二是企业在遇到这类问题的时候,会采取怎样的解决方案。

 

一、为什么黑灰产发布大量的违禁信息,企业很难识别?

在互联网黑灰产中,无论是行迹匆匆的羊毛党,还是浪迹论坛的水军,拥有各个平台的账号都是他们进入“职场”的第一步,批量注册大量账号就因此成为了所有恶意行为的源头。目前,这条黑色产业链已经形成上中下游的明确分工。首先,处于中游的号商会从上游的卡商那里购入一批手机号,然后利用接码平台、猫池、打码平台、其他自动化工具等批量注册虚假账号;随后,将账号售卖给下游用于薅羊毛、刷量、传播违禁内容等非法获利行为。

图片来网络:猫池

图为:接码/打码平台

内容平台散布违禁内容的源头正是这样一批账号。许多平台都会通过设置安全防护策略,或实名认证的方式在注册/登录环节对它们进行源头的过滤。但平台风控和黑产突破始终是一个持续博弈的过程,当黑产发现,利用新注册的账号发布广告等违规内容很快就会被平台发现并封号之后,他们会先让账号过上一段“正常人”的日子,在平台监控真的认为他们的“正常人”后,再撕下伪装的面具,在平台作恶,这种行为就是“养号”。

“养号党”利用群控技术+自动化脚本批量操控多个账号在平台发帖、留言或者点赞,这一切都是为了模拟正常个人用户的行为,逃过平台的风控规则。

图片来自网络:群控现场

根据威胁猎人的持续监控发现,刚注册的新账号根据不同平台可获利益不同,售价会在0.1-10元不等,在“养了”半年或者更长时间之后,价格就会翻上一番,达到1-100元或者更高的价格。如果账号“拥有了自己的姓名”,价格还能够进一步提升,只要从“料商”处买来身份证等实名信息绑定账号就能实现,此时的账号售价可以直接翻倍,达到10-200元甚至更多(比如微信账号)。

图为:威胁猎人反欺诈情报监测平台监测到的账号售卖情况

被“养过”的账号随后被买到下游黑产手中,用于广告营销、传播违规信息等途径,于是就有了内容平台上出现的黑账号。它们因为模拟成正常账号逃过了平台的防护规则。

之后,通过不断转变敏感词汇的表现形式(如,微信可以变成威信、VX等),黑产就能绕过平台对敏感词汇的过滤规则,再利用自动化脚本就能批量发布违规内容。

图为:违规信息

不过,其实现在黑产的日子也不那么好过了,这和平台采取的打击措施有关。

许多内容平台,在受到黑产的侵害后,会马上加大对内容的审核力度,通过风控策略拦截恶意账号,或者组建审核团队、搭建数据模型来打击平台作弊行为。

 

二、防范违规内容产生的基础措施

监管部门加大监管力度,内容平台提高自我审核力度已是目前的常态。强监管下,企业或强化自身审核能力,或与第三方合作探索提升内容安全的方式,但其底层逻辑都比较固定的,就是风控加持审核体系。

1、利用反欺诈风控体系,从源头拦截黑账号

前面说到的机器审核和人工审核机制,都是在违规内容出现之后进行内容管理的一种方式。

但在与黑产攻防对抗的过程中,我们发现,如果能在黑账号进入平台时、发布违规内容前就进行拦截,就能解决很大一部分违规问题。

在平台上发布违规内容的账号,通常是黑产在发卡平台先买入一批手机号,然后利用自动化工具批量注册的。如果平台能够通过账号识别体系,在黑产注册或登录当下就识别并拦截,就能阻止进一步的作恶。

我们在建立反欺诈体系建立过程中,通过对黑产业链核心节点的布控,能够掌握大量的黑产所利用的虚假手机号和恶意IP资源。当黑产利用这些资源进行账号的注册时,就可以在注册或登录环节进行风险账号的拦截或降权处置。

这一层防护体系,就能从源头上解决违规内容的产生。对于漏网之鱼,只要补充内容审核机制,大多数平台的内容安全问题基本都能解决。

2、补充内容审核机制,过滤违规内容


  • 利用机器审核过滤违规内容

目前,违规信息主要会以四种主要的形式出现在平台上,那就是文本、图片、视频和音频。

文本内容相对来说会比其他三种内容的处理成本低,平台可以自己维护一套动态文本库,持续收集和更新敏感违规词汇,也可以联系安全服务商接入一套外部文本库。其中的逻辑都是一样的,就是通过文本词库过滤的形式,筛选出违规的文字内容,然后进行后续的人工处理或直接删除等操作。

而对于除文本外的图片、视频和音频的视频,往往和人工智能、机器学习技术挂钩。要搭建一整套智能审核体系,需要比较高的成本。因此,对于这类内容,平台会选择接入安全服务商的服务。

图为:机器审核涉及的智能技术

以图片审核为例。在图片上会出现两种违规形式:


  • 一种是图片本身的内容是违规属性的,比如,图片中出现有色情、武器、暴力场景的画面;

  • 另一种是人为后期给图片加入了违规信息,比如,图片上添加了推广二维码、微信号码、电话号码等内容

针对这两类图片,利用第三方的智能识别技术就能进行识别。而服务商只要不断利用收集到的图片数据信息对模型进行组合训练,保证模型的快速迭代,就能进一步提升识别的准确率。


  • 人工辅助审核,降低误判率

充分利用人工智能技术对违规内容进行识别,在很大的程度上,其实就是为了节省人力。但实际上,不管行业把人工智能技术吹得多牛X,就现阶段来说,这项智能技术都会有不够智能的时候,还是少不了人工的辅助。

图为:人工审核+机器审核相辅的审核机制

就拿“扫码”这个词儿来说,它可以变成扌彐 石马,少马,扫**码等各种形式,人工智能并不能精准识别所有变体。另外,对敏感内容的过滤规则设置还不能过于严格,不然,就会出现误杀正常内容的情况。

在这样的情况下,人工审核就是一个必不可少的环节。

不同的平台可以利用机器审核机制设置不同的审核策略,然后对违规内容的可判性打上不同程度的标签,然后进行相应的处理。

比如,对于确定是违规的内容,可以标为【高危】,直接删除或封号处理;对于涉嫌违规的内容,可以标为【中危】,然后给予文字警告;对于命中少量违规内容,但无法准确判定性质的可以标为【低危】,对于低危的内容就可以由人工审核处理,避免造成误杀。

人工审核的环节对于所有做内容的平台都至关重要。目前,比较大型的内容平台,甚至会自己设立人审机制,少则十几人,多则数千人,专门审核平台内容。

 

写在最后

在具体的实践中,不同平台会有不同的内容展示形式,最终的解决方案和规则设定就会因“平台”而异了。但不论什么平台,都需要认识到的一点是,黑产的攻击手段总是在不断进化,为了躲避拦截策略,会不断出现新的内容发布形式,平台方只有持续关注内容管理解决方案,业务安全方只有不断迭代防护技术,才能在这场“猫鼠游戏”中占据上风。

 

关于我们

威胁猎人是一家反欺诈服务&内容安全服务提供商,基于领先的反欺诈技术、海量的数据、丰富的安全经验积累,解决互联网行业内存在的欺诈问题。并先后推出业务反欺诈、内容安全等系列服务。我们拥有一整套国内领先的业务安全情报监控与预警体系,形成了强大的黑灰产布控能力。目前已为腾讯、百度、阿里、华为等互联网企业提供业务安全服务。


推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 数字账号安全与数据资产问题的研究及解决方案
    本文研究了数字账号安全与数据资产问题,并提出了解决方案。近期,大量QQ账号被盗事件引起了广泛关注。欺诈者对数字账号的价值认识超过了账号主人,因此他们不断攻击和盗用账号。然而,平台和账号主人对账号安全问题的态度不正确,只有用户自身意识到问题的严重性并采取行动,才能推动平台优先解决这些问题。本文旨在提醒用户关注账号安全,并呼吁平台承担起更多的责任。令牌云团队对此进行了长期深入的研究,并提出了相应的解决方案。 ... [详细]
  • 如何使用代理服务器进行网页抓取?
    本文介绍了如何使用代理服务器进行网页抓取,并探讨了数据驱动对竞争优势的重要性。通过网页抓取,企业可以快速获取并分析大量与需求相关的数据,从而制定营销战略。同时,网页抓取还可以帮助电子商务公司在竞争对手的网站上下载数百页的有用数据,提高销售增长和毛利率。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 本文介绍了互联网思维中的三个段子,涵盖了餐饮行业、淘品牌和创业企业的案例。通过这些案例,探讨了互联网思维的九大分类和十九条法则。其中包括雕爷牛腩餐厅的成功经验,三只松鼠淘品牌的包装策略以及一家创业企业的销售额增长情况。这些案例展示了互联网思维在不同领域的应用和成功之道。 ... [详细]
  • 近年来,大数据成为互联网世界的新宠儿,被列入阿里巴巴、谷歌等公司的战略规划中,也在政府报告中频繁提及。据《大数据人才报告》显示,目前全国大数据人才仅46万,未来3-5年将出现高达150万的人才缺口。根据领英报告,数据剖析人才供应指数最低,且跳槽速度最快。中国商业结合会数据剖析专业委员会统计显示,未来中国基础性数据剖析人才缺口将高达1400万。目前BAT企业中,60%以上的招聘职位都是针对大数据人才的。 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • 本文介绍了adg架构设置在企业数据治理中的应用。随着信息技术的发展,企业IT系统的快速发展使得数据成为企业业务增长的新动力,但同时也带来了数据冗余、数据难发现、效率低下、资源消耗等问题。本文讨论了企业面临的几类尖锐问题,并提出了解决方案,包括确保库表结构与系统测试版本一致、避免数据冗余、快速定位问题等。此外,本文还探讨了adg架构在大版本升级、上云服务和微服务治理方面的应用。通过本文的介绍,读者可以了解到adg架构设置的重要性及其在企业数据治理中的应用。 ... [详细]
  • 树莓派语音控制的配置方法和步骤
    本文介绍了在树莓派上实现语音控制的配置方法和步骤。首先感谢博主Eoman的帮助,文章参考了他的内容。树莓派的配置需要通过sudo raspi-config进行,然后使用Eoman的控制方法,即安装wiringPi库并编写控制引脚的脚本。具体的安装步骤和脚本编写方法在文章中详细介绍。 ... [详细]
  • 本文介绍了绕过WAF的XSS检测机制的方法,包括确定payload结构、测试和混淆。同时提出了一种构建XSS payload的方法,该payload与安全机制使用的正则表达式不匹配。通过清理用户输入、转义输出、使用文档对象模型(DOM)接收器和源、实施适当的跨域资源共享(CORS)策略和其他安全策略,可以有效阻止XSS漏洞。但是,WAF或自定义过滤器仍然被广泛使用来增加安全性。本文的方法可以绕过这种安全机制,构建与正则表达式不匹配的XSS payload。 ... [详细]
  • 2022年的风口:你看不起的行业,真的很挣钱!
    本文介绍了2022年的风口,探讨了一份稳定的副业收入对于普通人增加收入的重要性,以及如何抓住风口来实现赚钱的目标。文章指出,拼命工作并不一定能让人有钱,而是需要顺应时代的方向。 ... [详细]
  • 小程序自动授权和手动接入的方式及操作步骤
    本文介绍了小程序支持的两种接入方式:自动授权和手动接入,并详细说明了它们的操作步骤。同时还介绍了如何在两种方式之间切换,以及手动接入后如何下载代码包和提交审核。 ... [详细]
  • 分享css中提升优先级属性!important的用法总结
    web前端|css教程css!importantweb前端-css教程本文分享css中提升优先级属性!important的用法总结微信门店展示源码,vscode如何管理站点,ubu ... [详细]
  • 手把手教你使用GraphPad Prism和Excel绘制回归分析结果的森林图
    本文介绍了使用GraphPad Prism和Excel绘制回归分析结果的森林图的方法。通过展示森林图,可以更加直观地将回归分析结果可视化。GraphPad Prism是一款专门为医学专业人士设计的绘图软件,同时也兼顾统计分析的功能,操作便捷,可以帮助科研人员轻松绘制出高质量的专业图形。文章以一篇发表在JACC杂志上的研究为例,利用其中的多因素回归分析结果来绘制森林图。通过本文的指导,读者可以学会如何使用GraphPad Prism和Excel绘制回归分析结果的森林图。 ... [详细]
  • Windows7企业版怎样存储安全新功能详解
    本文介绍了电脑公司发布的GHOST WIN7 SP1 X64 通用特别版 V2019.12,软件大小为5.71 GB,支持简体中文,属于国产软件,免费使用。文章还提到了用户评分和软件分类为Win7系统,运行环境为Windows。同时,文章还介绍了平台检测结果,无插件,通过了360、腾讯、金山和瑞星的检测。此外,文章还提到了本地下载文件大小为5.71 GB,需要先下载高速下载器才能进行高速下载。最后,文章详细解释了Windows7企业版的存储安全新功能。 ... [详细]
author-avatar
吴力强尹泽楠1991
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有