概率论基础
10.1 概率的基本概念
定义
- 概率论是研究随机事件及其规律性的数学分支。它描述了事件发生的可能性,并通过概率来量化这种可能性。
概率空间
- 样本空间(Sample Space):所有可能结果的集合,记作 $ S $。
- 事件(Event):样本空间的一个子集。事件可以是一个单一结果,也可以是多个结果的集合。
- 概率(Probability):事件发生的可能性,取值在 [0, 1] 之间。
概率的公理
- 非负性:对于任何事件 $ A $,有 $ P(A) \geq 0 $。
- 归一性:样本空间的概率为 1,即 $ P(S) = 1 $。
- 可列可加性:如果事件 $ A_1, A_2, \ldots $ 两两互斥,那么
$$
P\left(\bigcup_{i=1}^{\infty} A_i\right) = \sum_{i=1}^{\infty} P(A_i)
$$
- 对初学者最常见的两个互斥事件 $ A $ 和 $ B $,上式可写成 $ P(A \cup B) = P(A) + P(B) $。
10.2 条件概率与独立性
条件概率
- 条件概率是指在事件 $ B $ 已经发生的条件下事件 $ A $ 发生的概率,记作 $ P(A|B) $:
$$
P(A|B) = \frac{P(A \cap B)}{P(B)}
$$
条件概率的前提是 $ P(B) > 0 $。
独立性
- 事件 $ A $ 和事件 $ B $ 是独立的,当且仅当 $ P(A \cap B) = P(A) \cdot P(B) $。
- 对于独立事件 $ A $ 和 $ B $,有 $ P(A|B) = P(A) $ 和 $ P(B|A) = P(B) $。
10.3 随机变量与分布
随机变量
- 随机变量是一个将样本空间的每个结果映射到实数的函数。随机变量可以是离散的或连续的。
- 离散随机变量:取有限个或可数无限个值。例如,掷骰子的点数。
- 连续随机变量:可以取任意实数值。例如,人的身高。
概率分布
- 离散概率分布:描述离散随机变量的每个可能值及其对应的概率。例如,掷骰子的概率分布是:
$$
P(X = x) = \frac{1}{6} \quad \text{对于} \ x \in \lbrace 1, 2, 3, 4, 5, 6 \rbrace
$$
- 连续概率分布:通过概率密度函数(PDF)来描述。例如,正态分布的概率密度函数为:
$$
f(x) = \frac{1}{\sqrt{2 \pi \sigma^2}} e^{-\frac{(x - \mu)^2}{2 \sigma^2}}
$$
其中,$ \mu $ 是均值,$ \sigma^2 $ 是方差。
期望与方差
- 期望(Expected Value):随机变量的加权平均值,表示随机变量的中心位置。离散随机变量的期望计算为:
$$
E(X) = \sum_{i} x_i \cdot P(X = x_i)
$$
连续随机变量的期望计算为:
$$
E(X) = \int_{-\infty}^{\infty} x \cdot f(x) , dx
$$
- 方差(Variance):随机变量与其期望值之间的平方差的期望,表示随机变量的离散程度。计算公式为:
$$
\text{Var}(X) = E[(X - E(X))^2]
$$
方差的平方根称为标准差(Standard Deviation)。
10.4 常见概率分布
离散分布
- 伯努利分布:描述只有两个可能结果(成功或失败)的随机实验。概率质量函数为:
$$
P(X = 1) = p, \quad P(X = 0) = 1 - p
$$
- 二项分布:描述进行 $ n $ 次独立伯努利试验中成功的次数。概率质量函数为:
$$
P(X = k) = \binom{n}{k} p^k (1 - p)^{n - k}
$$
- 泊松分布:描述单位时间或单位空间内事件发生的次数。概率质量函数为:
$$
P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}
$$
连续分布
- 均匀分布:描述随机变量在某一范围内均匀分布。概率密度函数为:
$$
f(x) = \frac{1}{b - a}, \quad \text{对于} \ a \leq x \leq b
$$
- 正态分布:描述许多自然现象的分布,形状为钟形曲线。其概率密度函数为:
$$
f(x) = \frac{1}{\sqrt{2 \pi \sigma^2}} e^{-\frac{(x - \mu)^2}{2 \sigma^2}}
$$
- 指数分布:描述事件之间的时间间隔。概率密度函数为:
$$
f(x) = \lambda e^{-\lambda x}, \quad \text{对于} \ x \geq 0
$$
10.5 大数法则与中心极限定理
大数法则
- 大数法则表明,当进行大量独立的随机实验时,样本均值会趋近于期望值。常见的形式有弱大数法则和强大数法则。
中心极限定理
- 中心极限定理表明,对于独立同分布的随机变量,其和的分布趋近于正态分布,即使原始分布不是正态分布。这在样本量足够大的情况下尤其适用。
例子
- 实际应用:在金融市场中,中心极限定理可以用来估计资产收益的分布。
- 调查研究:在社会科学调查中,大数法则用于预测样本均值接近总体均值。
10.6 这章在经济学里回答什么问题
问题 1:未来有不确定性时怎么分析选择
- 概率论让你能讨论风险、预期收益、保险、投资组合和预期效用。
问题 2:样本里看到的波动有多大可能只是随机结果
- 这为后面的统计推断、假设检验和计量模型打基础。
问题 3:面对重复随机事件,长期平均会怎样
- 大数法则和中心极限定理解释了为什么样本平均、估计量和市场经验规律有分析价值。
概率论是分析随机现象的基础,广泛应用于统计学、金融、工程、科学研究等领域。掌握概率论的基本概念和定理对于理解和解决实际问题非常重要。