AR人工智能9号社区

能阻挡TikTok的,只剩了这一件事

内容审核是字节跳动绕不过去的一座大山。抖音在国内所面临的压力,TikTok在海外也没能幸免。

印度一位TikTok创作者上传了一段向女性泼酸性液体的视频,再次引发对于TikTok的广泛争议。大量印度用户表示将抵制TikTok,并在Google Play商店中对TikTok给了1星级评价,导致TikTok的评分一度从4.5星陡降至1.2星。

A tiktok creator in India has uploaded a video of splashing acidic liquids on women, which has once again sparked widespread controversy over tiktok. A large number of Indian users said they would boycott tiktok and gave it a 1-star rating in the Google play store, which led to a steep drop in tiktok's rating from 4.5 stars to 1.2 stars.

TikTok正高歌猛进海外市场,印度正是下载量 大的市场,迄今为止贡献了6.11亿次下载,占TikTok全球总下载量的30.3%。

字节跳动的出海梦想已照进现实,内容问题使TikTok深陷舆论漩涡,提升内容审核的精准度和速度,能为Tiktok的全球化进程减少一些阻力。

绕不开的人工审核

TikTok所面临的内容审核难题,是全球互联网公司共同心病。

亿欧智库研究院院长由天宇表示,在全球范围内,随着内容的数字化程度越来越高,数量越来越庞大,内容类型的复杂度不断增强,需要构建与之相匹配的内容管理机制。

近几年,Google、Facebook、Twitter都显著加强了内容审核的力度,激增的内容包括文字、图片、视频和音乐,审核技术正经受着新一轮的考验。

国内市场内容审核团队已成为大型互联网公司的标配。

以短视频业务为例,2019年1月发布的《网络短视频平台管理规范》显示,网络平台开展短视频服务,应根据其业务规模,同建立审计团队。审计人员的数量应与上传和播放的短视频数量相匹配。原则上,审计人员的数量应该是本平台每天播放短视频数量的千分之一以上。

字节跳动为此早已组建了规模庞大的审核团队,同时也在研发人工智能审核技术。

2018年,字节跳动副总裁张辅评曾表示,字节跳动确保对所有推荐内容进行人工审核,字节跳动审核团队人员已超过1万人,其中大部分从事视频审核。

同年,字节跳动副总裁、字节跳动人工智能实验室主任马维英表示,颤音一直使用人工智能辅助审计,构成人机交互的闭环:平台上有600多个机器学习模型,可以自动理解和识别内容;审计师也是标记者,用标记的数据训练模型帮助审计。

通过自主研发的AI技术,字节跳动节省超过十万的审核人力,人工审核团队却仍被保留。究其原因,除了管理规范的要求硬性要求外,AI审核的技术瓶颈也是原因之一。

AI审核的技术瓶颈

人工智能的局限性在于,不能对所有的媒介形式进行精准识别。

对于图片和视频来说,人工智能介入审核非常有效,因为计算机视觉识别技术相对成熟。机器通过一定时间的训练,都能够识别出敏感类别的内容,比如裸体、枪支等。

instagram人气

分析析语音和文本时,无法达到识别图片和视频的高精度。不同的文本在不同的语境下可能有不同的含义。人工智能很难像人一样思考和理解语言的真正含义。背景音和噪音会干扰识别。在方言识别方面,人工智能有点困难。

图普科技创始人兼CEO李明强坦言,内容审核目前 大的障碍是语音,国内市场面临方言识别难题,出海企业要针对当地语言配置小语种识别,技术难度大于方言。

在由天宇看来,语音审核在研发阶段需要投入较高的成本,语音内容的精准识别难度较大,语义的复杂性也带来了诸多挑战。

与人类能够对新事物进行思考不同,深度学习技术只能根据既有的数据进行训练,对新出现的不良内容,人工审核进行甄别,对用户行为进行判断,在此基础上,才能总结经验“传授”给AI。

如果AI审核出现问题,平台也需要承担法律风险。

政法大学传播法研究中心副主任朱伟表示,人工智能审计是基于深度学习的人工智能,其中的程序和算法实际上反映了一个平台的价值观和法治观。无论这种技术是由平台自主开发还是由第三方提供,一旦出现问题,平台都必须承担责任。

从安全和成本两个方面来考虑,通过AI审核进行初筛,再将疑似有害内容送达人工审核二次判断,依然是内容平台普遍采用的审核模式。

自研技术并非标配

参与UGC内容的平台越来越多,用户上传的内容作品质量参差不齐,对内容审核的需求也越来越大。介绍AI审核工具成为内容平台的必由之路,至于选择自主研发审核工具,还是与服务提供商合作,要看平台本身的考虑。

亿欧业内人士了解到,字节跳动并没有引入外部内容审核工具,这可能是由于数据保护的需要。在内容审核方面,腾讯、阿里、百度等网络龙头企业都有布局,如果选择与外部机构合作,可能会有将平台内容和数据泄露给竞争者的风险。

AI审核工具需要大量数据进行训练,字节跳动旗下拥有多个内容平台,能够建立较为完备的数据库,工具研发后可以高频应用。字节跳动对于内容审核工作十分重视,选择自主研发可能更适合自身发展需求。

哪些企业会选择第三方提供的AI审核服务呢?根据李明强的经验,与头部企业相比,腰部企业更愿意引进内容审核领域的合作伙伴,将资源和精力放在 核心的创新业务上,很少采取自主研发的方式。

人工智能审计公司相对于市场来说更具审计优势,李明强表示,某个平台的不良样品种类和数量都比较有限,服务提供商的介入可以起到众包和共享的作用。不良内容出现在一个平台上,可以快速进入数据库,在为其他公司服务时更方便、更安全。

中娱智库创始人高东旭认可了这一观点,创业型内容平台资金和技术实力有限,只能通过第三方的工具和平台来进行内容监管。目前国内的数美科技、图普科技、百度智能云、金山云和阿里云等,都能提供相关的服务和工具。

如果平台想从源头上降低内容风险,除了引进第三方机构进行内容审核外,提高团队的控制能力也很重要。可以请行业专家在内容制作之前对内容制作人进行培训,在内容制作阶段可以避免一些风险,同时也要加强对法律法规及相关政策的了解。

出海平台如何过审核关

内容平台出海,并不是字节跳动独有的战略。

今年5月初,快手在美国发布了应用Zynn,允许用户上传、编辑和分享短视频。据Sensor Tower提供的数据,在Zynn发布的一个月后,就成为了美国下载量 高的iOS应用。

欢聚时代旗下的泛娱乐直播平台BIGO LIVE也在海外取得了不俗成绩。2020年 季度,欢聚时代的全球平均移动端月活跃用户达到5.2亿,其中77.0%来自海外市场。

作为行业观察者,由天宇站在时间沿革的角度,回顾了互联网企业的出海历程。在互联网领域, 公司 早的出海产品主要为工具和游戏,认知属性和内容色彩较弱,以B2C模式为主。此后,资讯类产品又成为了出海的热点,内容多以PGC的形式生产,内容审核方面的压力仍不算太大。

As an industry observer, from the perspective of time evolution, Tianyu reviewed the journey of Internet enterprises to the sea. In the field of Internet, the earliest products of Chinese companies are mainly tools and games, with weak cognitive attributes and content color, mainly B2C mode. Since then, information products have become the focus of the sea. Most of the content is produced in the form of PGC, and the pressure of content audit is not too great.

国内娱乐平台、社交平台陆续出海,带来了UGC内容的激增,对平台内容审核能力的要求越来越高,十分考验平台内容和当地文化的兼容程度,以及平台运营商的文化理解能力、沟通协调能力和问题解决逻辑。

AI审核技术的第三方服务也跟随平台走向海外市场。“图普针对海外市场研发的图像审核产品,已经在全球多个地区部署了计算 ,其中海外市场应用 广泛的是暴力、 、未成年识别等审核场景。”李明强说道。

AI审核的技术瓶颈也在出海过程中体现。东南亚、印度、非洲是 互联网平台出海的主要方向,这些 和地区都具有语种多样的特点,AI技术则只能在图像、视频审核上沿用国内数据,势必有所局限。

TikTok在印度市场遇阻正是例证。拥有13亿人口的印度拥有巨大的市场空间,对内容提供商的挑战是复杂的语言体系、多样的宗教和文化背景,甚至还有当地尖锐的社会议题。

2019年2月,TikTok就曾因内容问题被印度政府封禁。作为应对,字节跳动在印度沿用了AI技术与审核团队协作的内容审核流程,审核团队可以支持14种语言,并用本地语言做出与文化相关的决定。

字节跳动计划在2019年12月之前将印度分公司员工人数增加到1000人。此外,字节跳动还在印度雇佣了超过250名的专职内容审核员。

越来越多的互联网平台尝试到海外发展,做好前期准备工作,可以避免内容违规后的被动整改。

作为法律从业者,朱巍为出海平台归纳了避免违规的要点。首先是对儿童权益的保护,杜绝儿童 等内容的出现,否则在各个 都将面临顶格处罚。

做好用户的个人信息保护也至关重要,在美国、欧盟、新加坡等地,适用的个人信息保护规则可能都不相同,在抓取信息、推荐信息时需要注意当地法规。除此之外,还要遵守当地的文化和风俗。

高东旭则给出了进一步的建议:在出海前,互联网企业必须先行制定适用于海外市场的审核机制,避免平台内容出现问题。“出海平台可以在当地聘请法务人员、熟悉当地文化和宗教的人士,建立配套的审核机制。”

尾声

媒介形式的进一步多样化,正给内容审核带来新的挑战。

新兴的数字娱乐产业是高东旭关注的对象,根据他的观察,AR、VR的技术门槛正在降低,大量应用AR、VR技术的内容也在不断涌现,对于如何进行这一部分内容的监管,仍待企业和相关部门关注和进一步研究。

知识付费催化了语音内容的发展,喜马拉雅FM、荔枝FM、得到等平台的音频内容数量激增,质量参差不齐,针对语音内容的监管力度也在加强。

李明强十分看好内容审核产品的未来:“随着5G和融媒体的发展,平台的内容量将会呈几何级数增长。内容审核技术是一个底层服务,市场需求会持续变大。”