本字幕由TME AI技术生成

见到平均值的时候

我们不仅要确定这个平均值是平均数

中位数还是众数

还要判定最小数值与最大数值之间的差距

即全距

以及每个数值出现的频率

也就是数值分布

如果不弄清这些

贸然的相信一个平均值

可能就会让我们难以看清真相

测定平均值的方法有三种

每种方法都可以给出不同的数值

平均数

把所有数值相加

用总数除以相加的数目

中位数

将所有数值从高到低排列

找到位于最中间的数值

众数

计算不同数值出现的次数

找出出现频率最高的数值

相关调查显示

大学生每周平均花在学习上的时间是十二点八小时

与二十年前的大学生相比

学习时间少了一半

你怎么看待这一结论呢

他是否就能证明大学生们在学业方面付出的努力变少了吗

当然不能

我们要看这里的平均值是按照哪一种方式计算的

如果有些学生花了很多的时间在学习上

比如一周三十至四十小时

那么平均数值就会被拉高

但不影响中位数或众数的数值

如果这里说的平均值是中位数或众数

那我们可能还高估了平均的学习时间

这个病愈后情况不太乐观

患同样癌症的病人

存活时间的中位数是十个月

你们不妨考虑一下

在病人生命最后的这段时间里

如何提高一下生活质量吧

听到医生给出这样的审判

作为病人家属会是什么心情呢

先别急着沮丧

医生说的话可以让我们明确知道

患这种癌症的病人

有一半不到十个月就去世了

另一半人存活时间超过了十个月

但仅仅知道这些还不够

我们还需要了解活下来的那些人存活时间的全据和数值分布

也许存活时间超过十个月的病人的数值全据和分布会显示

有些人

甚至很多人存活的时间远超十个月

甚至活到了七十至八十岁

知道病人存活情况的完整分布

可能会改变病人和家属对当下处境的看法

用更加恰当的心态去处理问题

有些数据可以证明一件事

但这并不意味着可以用这些数据去证明另一件性质截然不同的事

如果有人这样做

那么此时的数据就无法作为可靠的证据

如果你乘坐这个城市的地铁

你很有可能会丢失手机

我刚读了一份统计数据

说小型电子产品占地铁系统失窃率的百分之七十

上述的数据只能证明地铁系统中发生的大部分偷窃行为都和小型电子产品有关

但它没有证明这类偷窃行为发生的概率有多大

打开一切科学大门的钥匙

毫无疑问是问号

面对权威

面对真实的数据

面对看似严谨的理论

我们都需要敢于质疑