本字幕由TME AI技术生成
见到平均值的时候
我们不仅要确定这个平均值是平均数
中位数还是众数
还要判定最小数值与最大数值之间的差距
即全距
以及每个数值出现的频率
也就是数值分布
如果不弄清这些
贸然的相信一个平均值
可能就会让我们难以看清真相
测定平均值的方法有三种
每种方法都可以给出不同的数值
平均数
把所有数值相加
用总数除以相加的数目
中位数
将所有数值从高到低排列
找到位于最中间的数值
众数
计算不同数值出现的次数
找出出现频率最高的数值
相关调查显示
大学生每周平均花在学习上的时间是十二点八小时
与二十年前的大学生相比
学习时间少了一半
你怎么看待这一结论呢
他是否就能证明大学生们在学业方面付出的努力变少了吗
当然不能
我们要看这里的平均值是按照哪一种方式计算的
如果有些学生花了很多的时间在学习上
比如一周三十至四十小时
那么平均数值就会被拉高
但不影响中位数或众数的数值
如果这里说的平均值是中位数或众数
那我们可能还高估了平均的学习时间
啊
这个病愈后情况不太乐观
患同样癌症的病人
存活时间的中位数是十个月
你们不妨考虑一下
在病人生命最后的这段时间里
如何提高一下生活质量吧
听到医生给出这样的审判
作为病人家属会是什么心情呢
先别急着沮丧
医生说的话可以让我们明确知道
患这种癌症的病人
有一半不到十个月就去世了
另一半人存活时间超过了十个月
但仅仅知道这些还不够
我们还需要了解活下来的那些人存活时间的全据和数值分布
也许存活时间超过十个月的病人的数值全据和分布会显示
有些人
甚至很多人存活的时间远超十个月
甚至活到了七十至八十岁
知道病人存活情况的完整分布
可能会改变病人和家属对当下处境的看法
用更加恰当的心态去处理问题
有些数据可以证明一件事
但这并不意味着可以用这些数据去证明另一件性质截然不同的事
如果有人这样做
那么此时的数据就无法作为可靠的证据
如果你乘坐这个城市的地铁
你很有可能会丢失手机
我刚读了一份统计数据
说小型电子产品占地铁系统失窃率的百分之七十
上述的数据只能证明地铁系统中发生的大部分偷窃行为都和小型电子产品有关
但它没有证明这类偷窃行为发生的概率有多大
打开一切科学大门的钥匙
毫无疑问是问号
面对权威
面对真实的数据
面对看似严谨的理论
我们都需要敢于质疑