阿鲲的博客 主修软件工程和算法模型,极客成长中

概率与统计

2019-05-03
jktian

阅读:


连续型概率分布

正态分布

一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布。从理论上看,正态分布具有很多良好的性质,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。

中心极限定理

中心极限定理是说,当样本量N逐渐趋于无穷大时,N个抽样样本的均值的频数逐渐趋于正态分布, 并且这个正态分布以u为均值,sigma^2/n为方差。

大数定律

大数定律是说,n只要越来越大,我把这n个独立同分布的数加起来去除以n得到的这个样本均值(也是一个随机变量)会依概率收敛到真值u,但是样本均值的分布是怎样的我们不知道。

综上所述,这两个定律都是在说样本均值性质。随着n增大,大数定律说样本均值几乎必然等于均值。中心极限定律说,他越来越趋近于正态分布。并且这个正态分布的方差越来越小。

幂律分布(Power law distribution)

幂律分布表现为斜率为负的幂指数的直线,概率越高,占比越小,生活中的马太效应及长尾分布都是幂律分布的典型案例。简单来说,幂律分布就是告诉你世界是不公平的,较少的人拥有大部分财富(二八法则),于是在他们身上就体现了财富的加速积累情况。

贝叶斯定理的启示

有了新情况,我原来的看法会改变,新情况和自己的预期一致就强化原来的看法,否则就弱化,这不就是常识吗,还用得着什么数学定理吗?

拉普拉斯说过,所谓的概率就是把人们的常识用数学表达出来。也有人说,人脑就是采用贝叶斯方法来工作的。

但是我们人脑有偏差啊,有误区啊,会犯浑啊,这个公式让我们忽然获得了一个上帝视角,来审视一下,我们自己究竟是怎么做判断,做决定的,计算机又是怎么模仿并超越我们的,这岂不是很美妙的一件事情

贝叶斯定理给我们的启示 塔勒布说过,数学不仅仅是计算,而是一种思考方式。

现实世界中,我们没法时时刻刻拿出电脑来演算一下公式,但是我们仍然可以通过这个定理得到一些宝贵的启示:

1、先行动起来。

大胆假设,小心求证。不断调整,快速迭代。这就是贝叶斯方法。

当信息不完备时,对概率的判断没有把握时,当然可以选择以静制动,但是不行动也是有代价的,你可能会错过时机,你也没有机会进步。这个时候,贝叶斯方法给我们提供了一个很好的思路,先做一个预判,动起来,利用新的信息不断修正原来的预判。

2、听人劝、吃饱饭,但又不能听风就是雨。

当我们没有把握时,我们很容易根据新信息调整看法。更大的挑战是,我们已经形成了一个看法,甚至有了成功经验时,当新情况出现后,我们能不能也去调整自己看法。那个黑盒子,我们摸索了一段时间,估计出了里面红球、黑球的概率,但是我们有没有想过,这个黑盒子里的球的比例会变化呢?

有了新信息,我们要对原来的看法做多大程度的修正呢?

这些,不可能有标准答案,但是明白了这个道理,有助于我们及时又谨慎的做出调整。

3、初始概率很重要。

初始概率越准确,我们就能越容易、越快速的得到真实的概率。疑邻盗斧,以貌取人,会让我们离真相越来越远。而如何获得相对靠谱的初始概率,是个硬功夫,它需要你的经验、人脉、平时的深度思考,有时甚至和底层的价值观、思维方式都有关。

丹尼尔.卡尼曼在他的《思考,快与慢》里,就特地强调了初始概率对贝叶斯方法的重要性。

4、对出现的特殊情况要引起足够的重视。

前面我们已经看到了,万分之一概率的事情,也有可能因为特殊事件,一下子变成了50%。所以,每当出现特殊的、罕见的情况时,我们要保持高度警惕,黑盒子里的球的比例是不是变化了?但同时我们也看到,如果检测精度不够高,即便出现了罕见事件,真实概率也可能不到10%。所以,具体要怎么采取行动,还需要进一步观察。

5、信息的收集,信息的质量,以及对信息的判断,是提高决策水平的最重要环节。

只要有新信息,就可以修正,哪怕初始判断错了,新信息足够多,也能修正过来。但是没有信息,就没有修正。所以,在做决定之前,尽可能多的收集信息是必须的。但是错误的信息、低质量的信息,会让你的修正偏离真相越来越远,你能不能区分信息来源的可靠性、能不能进行交叉验证、逻辑推理,就显得至关重要。

要做到这些,甚至某一些,都并不容易,掌握里面的平衡,就更加困难。

所谓高手,就是把自己活成了贝叶斯定理。

数理统计

从样本出发, 估计出总体的分布.

两种方法

参数估计(点估计/区间估计),

立足于置信区间, 双边

假设检验

对统计量的假设, 立足于小概率. 拒绝域

sig^2的无偏估计量
  1. 如果mu已知, 且用s^2来估计,则分母为n
  2. 如果mu未知, 且用x的均值来估计, 则分母为(n-1)

从已知和未知出发, 主动构造一些量. 严谨的数学公式推导 估计量的评价: 无偏, 有效, 一致(如上述2中分母为n, 在n很大时,是一致的, 但是有偏)

  1. 无偏. 估计量的数学期望等于被估计参数的真实值,则称此此估计量为被估计参数的无偏估计
  2. 有效性就是看估计量的方差值,方差代表波动,波动越小越有效
  3. 一致性就是在大样本条件下,估计值接近真实值。

上一篇 DFS

下一篇 MTCNN网络

Comments

Content