统计数字为什么会产生误导,为什么又如此重要?使用定量推理的最佳方法是了解一个主题,并使我们能够使用这些知识来预测未来。数字是有说服力的,而一旦如果出现错误(有意或是不经意)他们可以造成严重的后果。
统计数字既可以是我们在理解事物道路上最有力盟友也可能成为最恶劣的敌人。使用定量推理常常是剖析某个项目的最佳方法,而且我们还可以使用这些知识去预测未来的结果。数字通常很有说服力,而一旦出现错误(有意或是不经意)它们可能产生极坏的影响。马克.吐温曾说过:这世上只有三种谎言---谎言、该死的谎言和统计数字!
所以,那对于我们意味着什么,各位尊敬的英雄联盟忠实消费者?
当拳头公司为职业比赛引入更好的历史数据时,统计学便覆盖着大联盟的发展。从文章到数据库,统计数字现在成为我们最常谈论的话题之一。最近的新闻是关于TSM的成员野龟,数字显示他与同行ADC选手相比伤害要低。这些数字可否被用来对该选手进行定位?我们能够一味信任这些统计数据而将它们作为独立参数吗?
如果我们看看其他职业体育,上述问题的答案是响亮的“yes”。“点球成金”理论与高级分析学已经加入MLB、NBA、NFL的讨论话题。在棒球比赛中,每个球员都有对应的统计数字,这些数字直观地反应对团队贡献的价值。我们完全可以通过统计数字比较两位球员谁更加出色,谁更有价值。
而在英雄联盟中,问题会变得含糊不清。答案往往是“probably not”任何个人统计数字都会受到团队打法风格而改变。没人可以通过统计来量化各选手带来的影响。这里请允许我举几个实力来趣味分析一番。
首先受打法的影响,我们以DPS统计数字为例。DPS反映一个团队的“血腥程度”。更频繁的团战意味着更多的伤害。此外,伤害与游戏时长不成线性比例;游戏后期的团战会导致更多更大的伤害。助攻率反应了战队的团战风格,无论是单杀还是5v5团战。金币收益率也会由于farm流英雄的影响饱受争议。
数据样本大小很容易理解,在棒球比赛中,一位球员在162场比赛的某赛季中可能会有场均4次的本垒打几率。一支NBA球队在某个赛季的82场比赛中,可能场均会有100 次的进攻机会。在北美和欧洲LCS职业联赛一个赛季会有18场比赛,一年会有2个赛季,总计年均36场比赛。加上30场季后赛(2个赛季x3BO5),我们仍然不能以这个统计数字类比其他体育项目。在英雄联盟赛场上一场比赛的统计数字不可以再被划分为更小的单元,这是事实。而篮球棒球的统计规则却适用与更大的取样范围,也更有说服力。
举项数字为例,让我们来看看金钱收益分配率。
了解战队成员表现的好方法之一就是看他的金币收入占整支队伍的百分比。这可以衡量一个团队的表现,所以(理论上)可以与其他队伍作比较。
然而这也不是完全正确。英雄联盟作为一个团队游戏,每一位成员都可能影响到其他成员的统计数字。获胜队伍总是有更高的金币收益率。所以,让我们来分析这个问题,以Fnatic(14:0)和Copenhagen Wolves(2:12)为例。
这项统计非常简练-玩家总金币/团队总金币,减去被动金币生成数。每个玩家的收入比例可以和人均数字相比,下面图示提供视觉参考:
我们首先要做的就是看看这个通常统计数字,然后加上(或减去)炮塔的价值。假设由于推塔造成产生1260的金币差。而一名选手(尤其是辅助)一场比赛可能只赚10k,这对他总体金币收益率的影响是巨大的。有多大?让我们再看:
所以,这些不是实际情况的反映,只是估计。和比较平均夸大了差异。我们看到,推塔收益会造成两队数值很大的差别。而这只是其中一个因素。
再来看thescore上的文章,Fnc,H2k,和OG提供他们的辅助选手更多的人均金币。所有这三支队伍都具备强力的辅助...以及良好的比赛成绩。高的人均金币收入往往就是他们获胜之道
所以这意味着什么?我们不能怀疑所有统计数字,认为它们都有缺陷。这些数据仍然是有价值的,我们只需要理解有些因素无法用数字解释。因此:英雄联盟统计数字不关联游戏背景则毫无意义。我们仍要支持统计分析,必须结合比赛细节加以理解。最终,我们将开发先进的统计参数,而在那之前,我们要对现有的数字进行多方面思考。