npn哪个比较稳定(神乎其神的NPS真能反映用户体验吗)

npn哪个比较稳定(神乎其神的NPS真能反映用户体验吗)(1)

NPS不仅不能帮你,还有可能害你

编者按:2003年,市场推广咨询师Fred Reichheld 在哈佛商业回顾上发表了一篇文章《你需要提高的唯一一个数字》,引发了商业界的热议。自此之后出现了大批的NPS信徒,但这个指标真的管用吗?本文编译自Noteworthy的、原题为“Net Promoter Score Considered Harmful (and What UX Professionals Can Do About It) ”的文章。

Fred Reichheld的观点是,企业只要问自己一个问题,而这个问题关注的是消费者的忠诚度。这样,管理层就能把控消费者对自己企业情感层面的体验。文章结尾他总结道“这是唯一需要提高的数字。就这么简单,但却至关重要”;然而,事情却没他想的那么简单,也没那么重要。这个数字没法让管理人员了解到客户是否忠诚。不过,净推荐值(简称NPS)确实满足了所有“实用”商业指标的基本的要求,易于衡量、有数字可追踪、让人觉得合理。

尽管很多研究人员都在研究中说明了NPS并没有这么神奇的作用,NPS的概念还是牢牢扎根于许多企业的脑海里,每天我们都能看到有企业推出新的NPS衡量项目,各行各业的领袖们也持续高唱NPS的赞歌,比方Stephen Bennett在任职Intuit的CEO时就这么说:现在,每个业务部门都将(NPS)作为其战略计划的一部分,它是每个运营预算的组成部分、是每个高管奖金的评估因素。每个月做运营评估时,我们都在谈论NPS值的进展。

利用这个指标来辅助关键决策的企业远不止Intuit一家,但是这个指标衡量的内容却不是他们所想象的那样。事实上,NPS衡量的内容并没什么特别之处,让我们来看看这个指标的实质到底有多虚。

NPS公式的背后:古怪的计算方法

净推荐值的评分与计算方式最疯狂的就是它的计算方式。 初始数据来源于一个简单的调查:你向朋友或同事推荐某公司的可能性有多大? 以0-11分为评分范围,0代表“根本不可能”,10代表“非常有可能”,让受访者从中用一个数字(后来的调查发展出了不同版本,Fred Reichheld建议调查者要问问受访者给出该评分的理由,我们稍后会解决第二个问题)。

一般的统计人员只会报告受访者所有评分的平均值。 然而NPS要的不是平均值,它的处理方法是,按分数将受访者分成三个部分:9或10分的受访者被称作推荐者,7或8分则是被动回复者,而评出6分及以下的是批评者。

NPS得分=推荐者占比 - 批评者占比

比方说,我们有10个受访者的分数。 数据是0,0,1,4,5,6,7,8,9和10。这10个数字的平均值是5。计算NPS得分,得出的是20%-60%,得出-40。·平均分是5分听起来还马马虎虎,比较中庸,但-40听起来就太糟糕了,虽然没有比-100糟,但是也够坏了。这是因为,NPS的基本思维是,一个给出中立评分的人不会像推荐者那样跟别人说公司的好话,中立评分者也不会忠诚,因此我们需要把这个中间群体转化为推荐者,所以目前给出中间评价的群体也算在批评者之列。

NPS无法体现用户体验

假如有一天我们运气不好,10位受访者全给出了0分,这十个数字的平均值也是0,NPS就是-100,这代表最糟糕的情况出现了,团队自然没有奖励,听起来很正常、也很合理。假设这个团队很努力,想要把产品变得更好,经过各种努力产品得到了10个6分的评价,平均值是6,但是NPS仍然是-100,这是因为NPS不能区别6和0,但却没有人在意这一点或注意到这个问题。所以,如果你在像Intuit这样的公司工作,所有人从0变为6所付出的努力都不会得到回报,CEO也拿不到奖金,就好像你从没努力过一样。好吧,就算你做了更多努力,每个人都给出了8分的评价,平均值也提升到了8,然而NPS也还是0;让用户对你的评价从0提升到8无疑是成功的,但NPS却仍是零!但分数从8提高到9时,平均分也是9,这时NPS就奇迹般地一下跳跃到了最高份100了!

正如以上举出的例子,NPS计算没有什么意义,这些分数变来便去、忽上忽下,背后并没有商业或数学原理。小的增量应该导致分数小幅度增加,大的改进才应该导致大的分数上的变化。然而NPS却不是这样来反映和变化的。这就是Kate Rutter所谓的“分析戏剧”(Analytics Theatre)。 让数字出现大幅度的变化来达到戏剧化的效果,其目的并不是帮助改进产品或服务的质量。相反平均值还能够更好的帮助我们了解数字的变化,虽然平均值是简单的,但却能揭示重要的信息。如果NPS的问题是其计算方式,那么我们用回平均值就万事大吉了吗?不,平均值也只有在数据本身具有意义时才有效,但不幸的是, NPS的那个问题所得到的信息和数据是没有意义的。

把背景噪音当作音乐来欣赏?从0-10打分的闹剧

如果我也做个调查, 问正在阅读本文的你:你觉得这篇文章有趣吗?,然后给你三个选项,1. 有趣,2.无趣,3. 不确定;你是很容易给出答案。如果给你5个选项,1. 有趣,2. 还好,3. 不确定,4. 有点无趣,5. 无趣,你回答起来就不那么简单了。什么叫“还好”?意思是说你有一点感兴趣但没那么多兴趣。如果有7个选择,就更困难了,光是给每个数字贴标签就很难了,所以我们换个方式:把7定义未很有趣,6和5不定义。4定义为“不确定”,3和2不定义,1定义为很无趣。问题来了,5和6有什么区别?3和2又有什么区别?用NPS的标准看都是负面评价,但5和6、2和3真的没区别、没本质差异吗?

NPS的评分有11个选择(0到10分),范围更大,但数字之间的区别并不鲜明。你和我用同一款产品,假设我们的体验时相同的,但我可能打7分,你打6分,这样的评分区别又意味着什么?或许你我够理解6和7的区别,但是很多受访者其实时无法区分两者的,他们选择某个数字的随机成分很大,但对企业来说,如果所有人给出6分,NPS就为-100,加入所有人给出7分,NPS是0,-100和0有非常大的区别;但对受访者来说,6和7就背景噪声一样没有意义,也无法解释为什么给6而不是给7分。所以NPS的最大问题是:问的问题不对、回答的也不着边;

表面上看来,客户是否愿意推荐涉及客户忠诚度,其作者首次在哈佛商业评论提出NPS概念时声称,NPS与重复购买和推荐有很积极的相关关系。但后来的研究表明,NPS与上述二者的关系并不大,原因如下:

好的研究是基于过去的体验和感受推断未来行为、而不是直接询问未来行为。如果受访者被问到:你愿意尝试健康的生活方式吗,或者你愿意尝试少吃糖吗、在或者你会购买这个产品吗? —— 这些问题要求受访者对自己未来的行为做出预测!英国分析顾问、NPS爱好者Dan Barker针对单一电子商务用户为期16个月的NPS数据显示,9个NPS数据点中虽然客户的评分从5到10都有,但这些数据没能告诉我们的是,受访者到底有没有真的去做问题里所问的事情?也就是说他们是否真的向同事或朋友推荐了某产品?Dan的数据显示,购买者对花费最高(110美元)的产品给出8分的评价,而花费较低的产品(57.6美元)则得到9分的评价;评分为5的产品与评分为10的产品、价格只差了3美元。从这份数据看来,消费行为和NPS评价之间没有太大关系,也显示不出客户忠诚度。

NPS真的能体现用户忠诚和增长吗?

培养客户忠诚是一个漫长的过程,这关乎一个人长期以来的行事习惯。 Fred Reichheld在其最初的哈佛商业评论的文章中说:忠诚指的是某人愿意做出投资或个人牺牲来加强关系,无论是客户,员工还是朋友。然而,NPS所问的问题并无论及投资或个人牺牲,甚至没谈到忠诚,只是问用户会不会推荐某公司。问受访者将来可能做什么,这不是忠诚度,这是乐观精神。如果我们真的有兴趣了解客户的忠诚度,可以问一个不同的问题:比如,在过去的六周里你是否有把某公司介绍给朋友或同事?事实上,Netflix运营早期向客户提出的就是这个问题。Netflix还问了另一个关键问题:你是否经同事或朋友推荐才使用了我们的服务?当人们对这些问题做出肯定回答时,Netflix的新用户和增长率也进入稳步上升阶段。而当人们不再回答“是”时,Netflix就看到不断有人取消订阅,获取新用户的速度也开始减慢。这些问题都与Netflix的增长直接相关,而这些问题询问的是用户过去的行为,而不是让它们对未来行为进行预测。

我写这篇文章的时候看到联合航空公司的网站说,我过去共飞行了891,116英里,今年乘坐了联合航空公司的49个航班,飞行了73,890英里。这个数据本身就显示了我是联合航空的忠实客户。但如果你在Twitter上关注我,会发现我经常吐槽联合航空的客户服务,如果联合航空要我在0到10分范围内给他们的航班服务打分,我的评价不会超过5分,我是联合航空的忠实客户吗?不管是NPS所问的问题(未来行为),还是Netflix问的问题,如果我诚实作答,我给联合航空的评分算很高了。关键是,虽然我总抱怨,但其实总是推荐联合航空。出了波士顿,他们真的是飞往美国西海岸目的地的最佳选择,他们的国际服务也在可以容忍的范围。但最好的选择未必代表“满意”,而是“最差的选择里”的最好的一个,我推荐他们不是因为我喜欢他们而是因为其他选择更糟糕。

有个朋友知道我在写这篇文章,向我介绍了他5天前使用花旗网上银行转了5美元之后收到的NPS调查。我不知道为什么会有人推荐花旗来做这样的事,NPS的设计目的并非让客户在这么小的细节上做反馈,这个问题完全可以在再做4次交易的时候再问。如果转账很顺利客户怎么会记得这种简单业务的细节呢?而许多公司是将NPS作为决策参考的,如果企业事无巨细的都希望得到NPS的反馈,那真的会带来大麻烦,因为他们得到的评价毫无意义

npn哪个比较稳定(神乎其神的NPS真能反映用户体验吗)(2)

将NPS嵌入定性研究

多年来我们研究NPS,想定性这个指标,因此要求受访者解释为什么给出那个分数,结果发现:人们并不了解NPS的问题。给出低分的受访者,使用还在实验阶段的产品或服务时体验可能相当完美,但依旧给出低分。我们询问原因,他们讲了一些自己过去的悲惨经历,因此不愿意推荐这项服务。我们再问他们后来有没有再使用该公司的产品或服务,他们说有、并且用了很多次。同样,也有用户在使用产品或服务时出现不好的体验,但最后的评分却是10,原因是“那比我想象的要好”,但当我继续问他们是否会再使用这个产品或服务时,他们说“可能不会”。另外,还有一些受访者给了0分,因为他们想不到要推荐给谁,或者因为朋友在这家公司工作、所以给了10分。当公司为受访者提供奖励,比如说有机会赢得100美元的亚马逊礼品券,受访者有更大的可能给出高分,因为他们认为“公司不会把奖品送给给自己评0分的人”。研究证实,NPS不仅没有告诉我们有关客户的体验或忠诚度的信息,甚至不会告诉我们任何有用的信息 !

NPS很容易被糊弄

如果为受访者提供的奖励与NPS评分上升相关,想要提高受访者的评分,提供100美元的奖励是个好方法。但这并不是糊弄NPS的唯一途径。一个理想的“欺骗”手段就是在成功完成某个任务之后再提出一个问题,例如在用户购买之后再询问,或者只问那些愿意购买的人。这样一来,任何因为使用体验不好而放弃产品或服务的用户就不会包括在调查范围内,这自然也就扭曲了NPS结果。而另一个诀窍是忽略回复率。大多数NPS的跟进或完成某个任务后调查的回复率只有4%-7%,答复率为7%意味着1个人在回复的同时也有13个人没回复,而这13人的评价会和已回复者的评价相同吗?可能不会。

npn哪个比较稳定(神乎其神的NPS真能反映用户体验吗)(3)

回复率低的一个原因是,对产品或服务使用的体验不佳,因此可能不会给你反馈。使用Fred Reichheld的忠诚度定义,这些人对进一步投资不感兴趣。为了真正糊弄NPS得分,就得鼓励批评者尽快退出,故意让他们有不好的体验,强迫他们放弃。这样,所有的受访者都倾向于积极的经验。即使你没有故意这样做,也很容易偶然发现这个漏洞,但几乎没有什么方法来纠正。这些黑暗的NPS糊弄技术可以产生更高NPS分数,带来更多的奖金。所以,我们认为NPS是有害的。

调查的真正价值都在于后续的问题

NPS的信徒告诉我们他们的企业没有任何其他的调查项目,只看NPS。每一个好的调查都跟着一个定性问题,让受访者给出原因。一些复杂的系统会根据受访者给出的评分改变问题,比如问推荐者“你喜欢我们什么?”,或问批评者“我们可以改进什么”?这些信徒说得头头是道,因为调查真正的价值在于找出背后的原因。对于这些NPS的支持者,我会告诉他们,获得这些有价值的数据是好事,但为什么要理会NPS的评分呢?只需要问用户质量方面的感知就可以了。而支持者的反应通常是嘟嘟哝哝碎碎念,或者说一些毫无意义、听不懂的天书。从定性研究中可以发现,NPS并不能反映出用户在使用期间发生的任何事情,我们在现实世界中收集数据,但NPS并不基于现实。

但我们的高管只想要一个数字!

最近,一家财富500强公司的高级副总裁告诉我:每个部门都会在会议上做展示,并给出一些数字,通常是NPS,如果我不使用NPS,就需要另一个数字。总之,我需要有一个数字来告诉大家该如何做。问题是,我们有千千万万个数字,但却没有一个数字能代表公司的客户体验,如果NPS不行,我们会追寻另一个数字,而且永远不会停止寻找的步伐。

用户体验不能用单一数字概括,这是NPS的最大缺陷。客户体验是客户与我们的产品、网站、员工以及品牌之间所有互动的总和,每个客户与产品、服务的互动过程都会有所不同。NPS信徒相信的并不是他们想要达成的目标,NPS更像是每日星座运势,这不是科学、而是一个信仰。作为UX专业人士,我们可能无法说服NPS信徒他们的占星术不是科学,但我们可以尝试躲开陷阱,采取更有效的措施为企业带来更多的价值。

转发文章。

原文请点击:blog.usejournal.com/net-promoter-score-considered-harmful-and-what-ux-professionals-can-do-about-it-fe7a132f4430

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页