概率分布是统计学和概率论中描述随机变量可能取值的一种数学模型。它们在多个领域有着广泛的应用,如金融、工程、科学和社会科学等。本文将简要介绍各种常见的概率分布,并通过实际例子解释低应用。

1 均匀分布

均匀分布是指在给定范围内的每个数值发生的概率相同。它可以是连续的或离散的。

实例:掷骰子。 在掷一个六面骰子的过程中,每个面(1到6)出现的概率都是1/6。

2 高斯分布(正态分布)

正态分布是自然界最常见的连续概率分布,形状为钟形曲线。它由两个参数表示:均值(μ),表示期望的位置,和方差(σ^2),表示数据的离散性。

实例:身高分布。 对于特定地区,人口的身高通常遵循正态分布规律。

3 二项分布

二项分布反映了n次伯努利试验成功发生的次数,其中每次试验成功的概率为p。

实例:抛硬币。 投掷10枚硬币时恰好投出5个正面朝上的概率可以使用二项分布来计算。

4 泊松分布

泊松分布描述单位时间、空间或区域内某事件发生的次数。 λ 表示该事件的发生率。

实例:客户到达速率。 一个银行每小时到达的客户数量可能服从泊松分布。

5 指数分布

指数分布描述了独立的随机事件之间的时间间隔,通常与泊松过程紧密相关。

实例:电话通话间隔。在呼叫中心,接到两个电话间的时间间隔服从指数分布。

6 Beta分布

Beta分布是定义在[0, 1] 区间内的一种连续概率分布,主要用作概率先验分布。

实例:产品合格率。假设2个参数a=10和b=3的Beta分布可用于表示产品合格率的不确定性。

7 Gamma分布

Gamma 分布适用于描述非负连续型数据的右倾现象,并可以构造其他分布如指数分布和卡方分布。

实例:预期寿命。 一种产品的使用寿命可能遵循 Gamma 分布模式。

8 t分布(学生t分布)

当样本规模较小,总体方差未知时,t分布充当正态分布角色来描述总体均值的位置补偿。

实例:体重指数测量。当样本数量较小时,我们可以使用t分布估计其所对应的总体平均体重指数。

9 F分布(费希尔分布)

F分布描述了两组给定自由度的样本方差的比率。它经常在方差分析(ANOVA)和回归分析中应用。

实例:药效评估。可以通过 F 分布比较两种药物对病人的Effect Size 差异是否显著。

10 Pareto分布

Pareto分布是一个具有长尾特性和“80/20法则”的分布,在经

分类&标签