亚马逊产品经理:TikTok 的真正优势,从来都不是算法(下)
TikTok的真正魔力在于:设计和流程里面的每一个元素是怎么互相关联到一起的
神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。
编者按:字节跳动往往被说成是一家算法公司,很多人认为,TikTok是靠算法的黑科技才取得成功的。事实真的是这样吗?eugenewei认为不是:TikTok的算法跟其他公司使用的并没有太大的不同。TikTok 大的优势是它采取了对算法友好的设计模式,在自己内部建立了一个飞轮,帮助其机器学习算法看到了优化自己所需要看到的东西。原文发表在其个人博客上,标题是:Seeing Like an Algorithm。篇幅关系,我们分两部分刊出,此为下半部分。
Editor's note: byte beating is often said to be an algorithm company. Many people think that tiktok's success depends on the black technology of the algorithm. Is that really the case? Eugenewei doesn't think so: tiktok's algorithm is not very different from that used by other companies. The biggest advantage of tiktok is that it adopts the algorithm friendly design pattern and builds a flywheel inside itself to help its machine learning algorithm see what it needs to see to optimize itself. The original text was published on his personal blog with the title of "seeing like an algorithm". We publish it in two parts, which is the second part.
划重点:
TikTok的真正魔力在于设计和流程里面的每一个元素是怎么互相关联到一起,从而创建出一个数据集,再通过这个数据集,把算法训练达到 佳性能的
大型社交网络默认的UI是无限垂直滚动的动态消息,对于算法来说用户的情绪信号不干净
社交网络已经做出了自己的取舍:为用户提供阻力更少的扫描,而牺牲掉对更精确的负面信号的读取。
TikTok有很多手段可以推断你是否对某条视频不感兴趣
对算法友好 终是为了服务好用户
任何设计的目标都不是让摩擦 小化,而是帮助用户达到一定的目的
在这个软件时代,真正的竞争优势或护城河已经变得越来越虚幻
如果说市场给人的感觉是越来越赢家通吃的话,那是因为在一个日益紧密相连的世界里,赢家的确能通吃
TikTok的算法能看到很多东西
我们不妨回到你在手机上打开TikTok看视频的那一刻。FYP算法现在可以让所有反馈回环形成闭环。它会研究你对这个视频的每一个操作,根据你的品味和视频的所有属性猜测你对视频的感受。
上述所有的步骤都不是像火箭 那样的硬核技术,尤其是对于任何从事算法性社会化动态消息的人来说这些并不新鲜。(我在之前那篇文章里面注意到,其实TikTok并没有一个很强的社交图谱。这款app之所以那么有效,原因之一是它不会假装自己不是的东西。也就是说,大家在其他地方已经有了大量的社交图谱以及跟自己认识的人分享的手段了。他们没有强迫大家在TikTok app里面也这样做,而是让下载视频或通过这些外部渠道分享视频变得非常简单。不过TikTok要保留的是你选择了分享视频的这个信号。这个数据就能(也只能)满足他们的算法了。由于视频会带有水印,所以分享就相当于给他们免费宣传。)实际上,TikTok已发表了一篇描述其FYP算法工作机制的博客文章,只要是从事技术业的,我相信大家看过之后都知道没什么新鲜的。
但是,把TikTok的FYP算法所看到的东西,跟其他大多数社交网络动态消息的推荐算法所看到的东西对比一下,你就会发现它们不一样在哪里。
在今天,我们 大型的社交网络默认的UI是无限垂直滚动的feed(比方说,我本来可以很容易地使用上面的Facebook屏幕截图)。这些app不是一次提供一个故事,而是一次在屏幕上显示多个条目。当你滚动浏览多个故事时,算法是没法“看清楚”你的眼睛停留在哪个故事上面的。就算能看到,如果用户没有按“点赞”之类的反馈按钮的话,他们对这个故事的看法还是正面的还是负面的呢?用户情绪的信号并不干净。
如果你赞成UI应该消除摩擦这个想法的话,那么无限滚动的feed应该就是理想选择。它提供了一种不受约束的消费节奏控制感。用拇指点一下某个feed,然后看着它像《价格竞猜》(Price is Right Showcase Showdown)节目里面的“大滚轮”的鼓点一样滚动,你的初始手势速度决定了它的滚动速度,看着软件的滚轮仿佛遇到了恒定的物理摩擦一样慢慢停止下来,这种模拟的物理过程是触屏时代 令人愉悦的用户交互之一。一下子你就能滚动浏览了5、6条推特或者Facebook的动态消息。多爽!
分页式设计,一次只能看到一个故事,而手指每推一次让feed滚动一条,不管是在字面上还是隐喻上都是一种拖累。
另一方面,如果Twitter更有针对性,也许你不会介意一次只看一条推文,如果Twitter能更好地了解你真正感兴趣的推文类型,他们的推文可能会更有针对性。如果你必须给每条推文一个明确或隐含的肯定或否定的信号,Twitter可能会更好地理解你真正感兴趣的内容。
即使是用户参与互动的故事,判断自己的情绪仍然是一个挑战。大部分app只有积极的反馈机制, 常见的是某种形式的赞按钮。因为Facebook、Instagram、Twitter等app都是基于社交图谱开发的,所以很明显为什么选择不提供不喜欢的按钮。
但正如史蒂芬·金在《写作这回事》中所写的那样:但如果你想成为一个成功的作家,那么粗暴的失礼应该是你 不需要关心的第二件事。而且你 不需要关心的 件事,就是这个文明社会和它对你的期望。假如你真诚坦白地写作,那么作为文明社会的一员,横竖你的日子也快结束了。
依靠有着明确正反馈机制的长滚动消息,像Facebook、Twitter以及Instagram这样的社交网络已经做出了自己的权衡,那就是为用户提供阻力更少的扫描,而牺牲掉对更精确的负面信号的读取。(在有着同样的创立CEO的那些旧公司里,你会看到这种权衡的另一个变体。这个人重新创业的时候,往往会有一群高管追随过去。被唯唯诺诺的人包围的危险在于,没有一个人会挑战你思考的盲点。谁是像贝索斯、库克、扎克伯格以及马斯克那样强势到足以改变大家的思想的人?这个问题永远值得一问。但答案往往是没有,所以他们的盲点就成为了公司的盲点。)
围绕兴趣地图建立的网络(如Reddit)确实有吸收踩踏机制的倾向,因为它们阻止用户流失的主要方向是为他们提供 有趣的内容。这意味着,就像暴露有吸引力的内容一样,用户不感兴趣的内容也应该被清除。
TikTok并没有明确的点踩按钮,但是通过每次只提供一条视频,他们可以从你是不是很快就略过不看(在视频还没播放完之前就向上滑动在Tinder上向左滑动一样。 好的TikTok用户对平台的叙事节奏有很直观的感受。该拖到什么时候才可以推出笑料的关键句或者payoff( 能象征整个故事的对象)观看者才不会走开呢?什么样的设定才能让用户参与?用已经融入到模因的音乐线索是有帮助的,因为当低音降下来或者音乐payoff出现的时候就已经预示了视频的高潮要来了。观看者知道还要多久payoff才会出现。此外,观看者可能纯粹为了听音乐的享受而乐在其中。),以及你没有哪一项积极举动来推断你是否对某条视频不感兴趣。
如果你点击了Facebook上某人发的文本帖子,但不做评论或者点赞的话,那Facebook怎么才能判断你对这篇帖子的看呢法?也许你考虑过在评论里面言辞激烈地表示不赞同,但是鉴于此人是你的同事或朋友的朋友,所以你决定还是不说为妙。这种负面情绪很难被抓住;算法“看不到”你的感受。(大多数社交网络都有明确用来报告令人反感和/或侮辱性内容的报告功能,但这些功能被掩埋了,大多数用户都不会诉诸这种手段。当有人的确用了这样的功能时,通常都是因为你极大地冒犯了别人,而且所造成的大部分伤害已经难以挽回。)
无聊或者会引起轻微不适的内容是慢性杀手。前一篇文章我指出,由于你自己的兴趣与你认识的人的兴趣不一致,通过社交地图获得的内容可能不符合用户的真实口味。动态消息通常是针对这种偏离的默认防御措施,从时间排序到算法管理。
但是,如果算法“看不到”用户愈发不感兴趣的信号的话,如果只能看到用户积极参与的信号的话,(内容与用户兴趣之间)难免会出现一定程度的分歧。你可能会看到用户逐渐失去兴趣,点赞变少了,打开你的app没那么频繁了,但你究竟是那些故事把他们赶走的却不清楚。等到用户开始表现出要离开的迹象时,往往是亡羊补牢为时已晚。
对算法友好 终是为了服务好用户
算法友好型设计不需要对用户友好。在如何 好地服务用户的兴趣方面,采取了不同的做法。页面可能会给用户带来一定程度的阻力,但这可以为算法提供更清晰的信号,从长远来看可以保证feed的质量。
尽量减少摩擦只是实现良好用户体验的一种手段。任何设计的目标都不是让摩擦 小化,而是帮助用户达到一定的目的。减少摩擦通常跟这个目标是一致的,但未必总是如此。你可能会说引用推文减少了手动复制他人推文的摩擦,但是如果你的目标是和谐文明的公共讨论的话,减少喷子涌到某人推文底下疯狂攻击的阻力也许并不是你要鼓励的核心机制。有一定形式的摩擦也是好的。
你会听到很多有影响力的Twitter用户劝其他人要早点用经常用禁言和屏蔽功能(有些用户甚至大量采用软屏蔽功能来秘密拉黑关注者)。有些用户会自豪地在推特上发布自己禁言了那些词的屏幕快照,以表示对某些热门讨论主题的不满。有些人更加极端,甚至取关联所有人,然后从头开始关注。(有时候,也可能是因为自家的A/B测试情况不错,Twitter会向用户展示自己关注的人点赞的推文(甚至包括来自用户并未关注的人的)。这种做法确实偶尔会展示出一些我感兴趣的推文,但从绝对意义而言,这样增加了我不感兴趣的推文的数量。我已经反复强调过很多次了:不存在兴趣一模一样的两个人。所以这项功能开启之后,我真的有取关所有人然后从头关注的打算了,但我又担心会伤害到别人的感受,因为我心肠很软。如果Twitter做法不一样的话,这个本来不是问题的。)
我有时也会考虑其中的部分或所有的策略,但对于Twitter来说,这些策略的必要性本身就是服务的失败。如果算法对什么是你感兴趣的东西能处理更聪明些的话,它应该留意一下替你禁言主题或者拉黑一些人。就像我上次所写那样,你可能得关注完Twitter上面的所有人才能获得有趣的内容,这也许是强大的兴趣图谱的一个设计缺陷。
TikTok不仅从用户那里捕捉到了非常清晰的情感信号,而且每一次对话都能收集到很多这样的信号。TikTok上的视频太短了,即使在一个简短的对话中,TikTok也能收集到很多关于你口味的反馈。
这个过程也相对没有什么痛苦。有的视频顶多可能会让你觉得厌烦,但是刷走这些视频只需要相对轻松的操作,同时,鉴于算法在仔细倾听你的意见,你甚至会享受这种把视频扫掉的操作,因为你知道app会登记你的不快并做出响应。(短视频正好是非常适合此类机器学习驱动型推荐的类别。当然,我不会说它适合这种类别的每一种类型。音乐是很合适的。时间不长,所以采样成本低,重复消费的价值高。而音乐的相似性通常是可以利用数学检测的。我的Spotify Radio推荐就很可靠。另一方面,算法的电影推荐对我来说从来都没起过作用。电影很长,采样成本很高。语料库也很小,每年只有大约500部电影之类的东西出现,而大多数人只看过其中的少数几部。这个主题需要另行讨论。)
顺带一提,TikTok并不是 一款针对匹配任务优化界面的app,而是那种每次只显示一个实体,这样你就能更清楚地知道自己的感受。每一次展示一个内容的UI都是在TikTok之前自成一派的。
向右滑和向左滑已成为表示认可和不认可的代名词是有原因的。Tinder在触摸屏UI上想出了一种感觉像是设计原语的二元投票方式。
飞轮的优势
在这个软件时代,真正的竞争优势或护城河已经变得越来越虚幻。大多数的软件功能或UI设计,一个既有者或竞争对手一夜之间就可以轻松复制。你做的一切不过就是帮他们先试试设计的影响如何。(有一次我去 的的时候,曾经跟一帮 的企业家共进晚餐,我提到了Instagram抄袭Snapchat的Stories引起的喧嚣。一家 顶级公司的首席产品官笑着说:“在 ,如果你的竞争对手在两周之内不能把你的某项成功的功能复制出来的话,那么他们肯定是不够格的。”硅谷自以为是点子市场的达尔文主义者,但从很多方面来说, 的科技界才是的真正的达尔文主义。这对于硅谷的相对产出而言是个不好的预兆,因为在 ,思想传播和变异的速度更快。人们通常说硅谷已经接替了波士顿的128号公路(曾经的电子工业中心)成为技术创新的地理中心,部分是因为硅谷更加开放的劳动力市场使得思想可以在公司之间自由流动。 已经拿到了这本手册,并且走得更远。在 的科技行业的竞争格局中要想生存下来,就像是想要从《黑暗骑士崛起》里面的那个坑里面爬出来一样。很恐怖。)
但是,如果你可以造出一个飞轮(比方说像TikTok的飞轮),那么像Reels或Triller这样的竞争对手就很难追上。Triller可能会花钱把TikTok的一些网红挖过来制作视频,Reels也许会尝试对Instagram引流,但TikTok之所以能行是因为通过FYP算法把创作者、视频以及观看者连接成一个正向的反馈回环。
Brian,Arthur(Brian,Arthur)提出了经济增长和路径依赖的理论。没有一个行业能像科技行业一样更明显地体现这个理论。这个行业中, 个实现产品市场匹配的竞争对手可能会脱颖而出。假如市场给人的感觉是越来越多的赢家吃东西,那是因为在一个越来越紧密的世界里,赢家确实会吃东西。
字节跳动往往被说成是一家算法公司,而TikTok在过去几周则被描述成了只靠这种算法的黑魔力而取得成功。很多人甚至认为,如果收购不包含算法在内的话,TikTok就不值得买。
我认为这是错误的。是的,重新训练FYP的推荐算法可能需要很长时间,以至于部分用户会流失。我并不认为这项工作是鸡毛蒜皮。但是,真正的魔力在于TikTok的设计和流程里面的每一个元素是怎么互相关联到一起,从而创建出一个数据集,再通过这个数据集,把算法训练达到 佳性能的。这个反馈回环里面没有一步是超出了美国众多追求者的能力范围之内的。你所需要做的只是要了解这个飞轮的机制,并保证让每一个要素和流程都正常运转。
在算法推荐的质量上,我所遇到的产品或服务似乎都遇到了天花板:Yelp,OpenTable,Google,Netflix等等。别误解我的意思,这里有些日子过得还不错。只是忍不住想,他们中的一些人能不能更上一层楼,对算法更友好的设计可能是一个可能的解决方案。
回顾一下,在我关于TikTok的系列文章的 篇当中,我讨论了它的算法是如何充当了一种匹配机制,使得TikTok成为了如此具有可扩性的娱乐网络的。相比之下,社交网络必须用社交图谱来逼近兴趣图谱,然后就带来了这种种问题。在有关TikTok的第二篇文章中,我重点介绍了它的设计是如何有效地帮助其机器学习FYP算法“看到”完成其工作所需的东西的。对算法友好的设计理念可能会成为其他垂直领域的其他公司在机器学习时代取得优势需要采用的一种模式。
但是,作为案例研究TikTok之所以那么的迷人而且异类,还有 后一个原因。这跟软件和算法的关系不大,而跟我孜孜不倦的文化决定论关系更大:那就是创意的网络效应。这会是本TikTok系列第三部分,也是 后一部分要讨论的主题。
However, as a case study, there is one last reason why tiktok is so charming and exotic. This has little to do with software and algorithms, but more to do with my tireless cultural determinism: the network effect of creativity. This is the third and final part of this tiktok series.
译者:boxi