汤姆逊公式的推导(威尔逊公式)

编辑导语:运营人员或创作人员若想让内容受到更多关注,则可以了解一下平台是如何进行内容推荐的。而在知乎,也许你可以结合威尔逊公式来了解知乎的算法推荐。本篇文章里,作者就对威尔逊公式及知乎运营做了一番解读,一起来看一下。

汤姆逊公式的推导(威尔逊公式)(1)

我们都知道,自媒体人通过在平台输出内容,从而吸引用户关注,完成流量变现,因此,很多人认为平台是自媒体人与用户之间沟通的桥梁。

这种观点其实没错,但更准确地说,自媒体人从来不是在和用户交流,而是在和平台博弈。

为什么说博弈呢?

因为任何一个平台都有其固定的机制算法,自媒体人要做的事情,是不断让自己的内容往平台算法上靠近,不断去触发平台的推荐机制。

我以知乎为例,很多人应该听过知乎的“威尔逊公式”,但具体不是特别理解,也不知道这个公式到底是如何计算的。

这里,我为大家详细科普一下,希望对一些从事知乎运营的朋友有所帮助。

首先需要了解,如果我们把运营知乎比喻成一个打怪游戏,那算法就是一份详细的攻略秘籍,它能告诉我们怪兽的要害是什么,以及下一步要如何走,这份攻略能让我们在打怪升级的过程中做到心中有数。

简单说,知乎算法的具象表现形式,就是个人的内容搜索排名。

运营人通过算法得到的数值越大,搜索排名就越靠前,曝光量就越高,相应得到的反馈就越多,而我们运营知乎的本质,就是想发设发的让我们得到的这个数值尽可能的大。

其次,在讨论具体公式之前,我们需要先思考一个问题,假如你是知乎平台的运营人,你会倾向于保留哪些用户呢?

答案很简单,凡是对平台建设能产生积极作用的人,平台自然要给出相应的回报,予以奖励。

这是一个平台想要长远发展的基础要求之一,不需要通过数据来证明。

而对用户而言,输出专业知识、筛选优质内容、提升社区活跃度、增加知乎影响力、维护平台秩序等等,都属于可以落地的平台建设操作。

所以,在我们不断产生这些行为的过程中,就是在为知乎不断赋能,也就理所应当的得到更高的算法数值。

理解这个概念之后,我们再来具体分析一下知乎的官方算法机制,算法中提到的各项数值,以及其执导意义和闭坑指南。

这里给出一个公式,即【威尔逊公式】:

汤姆逊公式的推导(威尔逊公式)(2)

其中u为加权赞同票数,v为加权反对票数,za为参数。

下面这张图可以比较直观地显示威尔逊公式的几个重要特性。

汤姆逊公式的推导(威尔逊公式)(3)

为了方便谈论,依次称左图中up-vote,down-vote,score对应的轴为x、y、z轴,右图为左图的等高线图。

左图的整体曲面形状,与通常理解中赞同票、反对票和回答质量的对应关系是相符的,这是知乎官方认可的算法机制。

加权赞同票指的是其他人点赞所赋予内容的数值,但要注意,每个人的点赞所带来的影响是不同的,这取决于点赞者在当下领域的权重。

很多人精心写了一篇文章,然后发布在知乎回答里,以为接下来就可以获得千赞、万赞,成为知乎大v,然而过了一段时间后,发现回答点赞数寥寥,甚至连一条反对的评论都没有。

这时,他们开始失望了,认为自己没有所谓的自媒体天赋,甚至不适合知乎运营。

这其实是一个误区,你的回答反馈不足,并不代表你的内容有问题,更不意味着这篇回答会一直无人问津。

事实上,从长远运营经验来看,一篇有价值的文章,就算一开始没什么反馈,也会在未来某一段时间里突然爆发,之所以现在没有造成一定程度的影响力,是因为你的账号目前还存在着一些问题。

比如,你写了一篇回答,一个十万粉的大v和一个几百粉的小号给你点赞,所带来的影响差距是很大的,这就是“加权”的概念。

同样,反对也是存在加权的,反对者的权重越高,我们的分数下降幅度也就越大。

这个公式看起来比较麻烦,大家刚开始看不懂也很正常,我把它精简一下,大家可以通过另一个公式来判断自己的权重。

即:s=点赞*收藏*喜欢*初始权重*评论*反对。

在这些影响因素中,除了领域下权重之外,其它因素都是通过用户之间的交互来实现的,也就是说,一篇文章的排名到底有多靠前,最终是通过其它用户来决定的。

除此之外,点赞、收藏和喜欢会提升回答的分值,而反对则会减少相应的分值。

到这里,有人会说了,你早这么说我就明白了,放这个威尔逊公式有什么作用呢?

还真有用,因为威尔逊公式除了能表达各个因素之间的对应关系外,还能简洁地表达因素变化后的发展过程。

具体表现为:

  • 固定反对票,赞同票越多得分越高;
  • 固定赞同票,反对票越多得分越低;
  • 固定赞同与反对的比例,总票数越高得分越高。

这个应该很好理解,就不多做说明了。

总投票数较少时,回答如果获得投票,得分会快速增加,总票数越大增加速度越慢,这是什么意思呢?

大家在运营知乎的过程中,会经常发现有些十几个赞同的回答排在很靠前的位置,而排在他之后的回答可能有几千几万个赞同。

这就是这条规则的意义。

知乎对于刚刚创作的内容,系统会根据创作者当下领域的权重给到内容一个加权基础分,以便其得到更大的曝光。

这一点是很合理的,因为相对于很早之前的回答来说,新回答如果没有一定的初始曝光,那它连被评判的资格都没有。

在系统赋予基础曝光的前提下,如果它能够得到第一批用户的认可,那系统就会判定这是个有潜力的内容,就会推送给更多的人,促成一个短时间内的爆发。

在这段时间里,虽然它的赞同数不如其它回答,但获赞速率很高,这就使得它能迅速提升排名,在一段时间内稳定在靠前的位置。

赞同数较高的回答,开始获得反对票时,得分会快速下降,总反对数越大,下降速度越慢,这一点与第二条原理有些相似。

关于这一点要如何理解呢?

试想一下,我们现实社会中的一个人,只要他的热度足够高,那就一定会出现争议,因为每个人的想法是不一样的,总会有不同的声音出现,但有了这些争议,不代表他就是一个坏人,他只是热度够高而已。

所以,当一篇内容的赞同数足够高,使它能被更多人看到的时候,就一定会有人提出反对意见,而在这个阶段,内容的得分会迅速下降,直到和赞同形成一个稳定的比例关系。

不过需要注意的是,只有在开始得到反对的那个阶段,才会有大幅度的分数变化,在之后的发展过程中,我们得到的反对次数越多,每个反对所造成的影响就越小。

那回到第二个公式上,即:s=点赞*收藏*喜欢*初始权重*评论*反对

从这个公式以及长期的运营经验中,我们可以得到如下六个重要原则:

  1. 所有用户看到的排序是相同的;
  2. 在其它条件保持不变的情况下,获得赞同会使回答的排序上升,获得反对则会下降;
  3. 用户在某个领域下创作的内容所造成的影响力,会提高用户在这个领域下的权重,也就是说,初始权重能够影响到内容得分,而内容最终得分又会反过来增强我们当下领域的权重;
  4. 领域下高权重用户的投票对排序有更重大的影响,这个投票包括点赞和反对,当然,高权重用户自己在回答相关问题时,由于初始权重的加持,其回答在开始时的位置会比较靠前;
  5. 使用匿名身份投票或答题时,不会计算用户的权重;
  6. 当前没有得到好的反馈的内容,不代表之后就没有成为高赞的可能。

根据威尔逊公式图像可以推断,一篇好的内容最后一定能够得到认可,只是时间会有所偏差,可能在开始的时候受到初始权重或者不稳定因素的影响,使它没有得到更多的曝光,但总会有一个时间点被人发现,并得到认可,这也是知乎分发机制的调控作用之一。

所以,内容是非常重要的,那句“内容为王”也绝不是空穴来风。

在完整地了解知乎的算法之后,我们能从中获得哪些重要信息呢?

或者说,我们应该如何最大化利用这份官方规则呢?

可以稍微总结一下,有如下两点:

  1. 在明白知乎的算法机制后,我们在创作一篇新的回答前,千万不要随心所欲地回答问题,而是要先思考自己的垂直领域是什么,然后再有选择地去寻找问题。
  2. 创作的过程中,要学会在原有基础上增加一些好玩的、容易被吐槽的点,也就是我常说的自媒体人要不断触碰用户的“痛点”和“爽点”,目的是主动与更多的用户产生交互。

当然,也有一些主动性的行为,比如在文章的最后,直接提醒读者点赞,甚至诱导读者点赞,这些都是增加交互行为的常见方式。

我之前有跟一些朋友说过,自媒体人有三大境界。

一是表达自我,这是很多初级自媒体人普遍会犯的毛病,把知乎当做一个表达自己的平台,甚至是情感树洞。

这是错误的运营方式,你表达自我没错,但如果你想的是曝光,想的是流量,以及后续的变现,那就不应该一味地表达自我。

二是服务用户,很多自媒体人已经有所体会,在写自媒体文章时,不是为了自己而写,而是为了用户而写,自媒体人更多的是充当一个媒介作用,把用户想要看到想要说出的观点给更好地表达及罗列出来。

三是触发平台规则,自媒体人为什么要为用户写文章呢?

本质上,当然不是为了让用户满意,而是通过用户的满意来触发平台的规则,从而让自己的回答能得到更高的曝光,进入更大的流量池里面。

这就很好地说明了,自媒体从来不是创作者与读者之间的争斗,而是创作者与平台的相互博弈。

感谢阅读~

作者:江寒;江寒的号

本文由 @江寒 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自Pexels,基于CC0协议

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页