概率论基础

10.1 概率的基本概念

定义

  • 概率论是研究随机事件及其规律性的数学分支。它描述了事件发生的可能性,并通过概率来量化这种可能性。

概率空间

  • 样本空间(Sample Space):所有可能结果的集合,记作 ( S )。
  • 事件(Event):样本空间的一个子集。事件可以是一个单一结果,也可以是多个结果的集合。
  • 概率(Probability):事件发生的可能性,取值在 [0, 1] 之间。

概率的公理

  • 非负性:对于任何事件 ( A ),有 ( P(A) \geq 0 )。
  • 归一性:样本空间的概率为 1,即 ( P(S) = 1 )。
  • 可加性:如果事件 ( A ) 和事件 ( B ) 是互斥的(即 ( A \cap B = \emptyset )),那么 ( P(A \cup B) = P(A) + P(B) )。

10.2 条件概率与独立性

条件概率

  • 条件概率是指在事件 ( B ) 已经发生的条件下事件 ( A ) 发生的概率,记作 ( P(A|B) ): [ P(A|B) = \frac{P(A \cap B)}{P(B)} ] 条件概率的前提是 ( P(B) > 0 )。

独立性

  • 事件 ( A ) 和事件 ( B ) 是独立的,当且仅当 ( P(A \cap B) = P(A) \cdot P(B) )。
  • 对于独立事件 ( A ) 和 ( B ),有 ( P(A|B) = P(A) ) 和 ( P(B|A) = P(B) )。

10.3 随机变量与分布

随机变量

  • 随机变量是一个将样本空间的每个结果映射到实数的函数。随机变量可以是离散的或连续的。
    • 离散随机变量:取有限个或可数无限个值。例如,掷骰子的点数。
    • 连续随机变量:可以取任意实数值。例如,人的身高。

概率分布

  • 离散概率分布:描述离散随机变量的每个可能值及其对应的概率。例如,掷骰子的概率分布是: [ P(X = x) = \frac{1}{6} \quad \text{对于} \ x \in {1, 2, 3, 4, 5, 6} ]
  • 连续概率分布:通过概率密度函数(PDF)来描述。例如,正态分布的概率密度函数为: [ f(x) = \frac{1}{\sqrt{2 \pi \sigma^2}} e^{-\frac{(x - \mu)^2}{2 \sigma^2}} ] 其中,( \mu ) 是均值,( \sigma^2 ) 是方差。

期望与方差

  • 期望(Expected Value):随机变量的加权平均值,表示随机变量的中心位置。离散随机变量的期望计算为: [ E(X) = \sum_{i} x_i \cdot P(X = x_i) ] 连续随机变量的期望计算为: [ E(X) = \int_{-\infty}^{\infty} x \cdot f(x) , dx ]
  • 方差(Variance):随机变量与其期望值之间的平方差的期望,表示随机变量的离散程度。计算公式为: [ \text{Var}(X) = E[(X - E(X))^2] ] 方差的平方根称为标准差(Standard Deviation)。

10.4 常见概率分布

离散分布

  • 伯努利分布:描述只有两个可能结果(成功或失败)的随机实验。概率质量函数为: [ P(X = 1) = p, \quad P(X = 0) = 1 - p ]
  • 二项分布:描述进行 ( n ) 次独立伯努利试验中成功的次数。概率质量函数为: [ P(X = k) = \binom{n}{k} p^k (1 - p)^{n - k} ]
  • 泊松分布:描述单位时间或单位空间内事件发生的次数。概率质量函数为: [ P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!} ]

连续分布

  • 均匀分布:描述随机变量在某一范围内均匀分布。概率密度函数为: [ f(x) = \frac{1}{b - a}, \quad \text{对于} \ a \leq x \leq b ]
  • 正态分布:描述许多自然现象的分布,形状为钟形曲线。其概率密度函数为: [ f(x) = \frac{1}{\sqrt{2 \pi \sigma^2}} e^{-\frac{(x - \mu)^2}{2 \sigma^2}} ]
  • 指数分布:描述事件之间的时间间隔。概率密度函数为: [ f(x) = \lambda e^{-\lambda x}, \quad \text{对于} \ x \geq 0 ]

10.5 大数法则与中心极限定理

大数法则

  • 大数法则表明,当进行大量独立的随机实验时,样本均值会趋近于期望值。常见的形式有弱大数法则和强大数法则。

中心极限定理

  • 中心极限定理表明,对于独立同分布的随机变量,其和的分布趋近于正态分布,即使原始分布不是正态分布。这在样本量足够大的情况下尤其适用。

例子

  • 实际应用:在金融市场中,中心极限定理可以用来估计资产收益的分布。
  • 调查研究:在社会科学调查中,大数法则用于预测样本均值接近总体均值。

概率论是分析随机现象的基础,广泛应用于统计学、金融、工程、科学研究等领域。掌握概率论的基本概念和定理对于理解和解决实际问题非常重要。