概率论基础

10.1 概率的基本概念

定义

概率论是研究随机事件及其规律性的数学分支。它描述了事件发生的可能性，并通过概率来量化这种可能性。

概率空间

样本空间（Sample Space）：所有可能结果的集合，记作 $ S $。
事件（Event）：样本空间的一个子集。事件可以是一个单一结果，也可以是多个结果的集合。
概率（Probability）：事件发生的可能性，取值在 [0, 1] 之间。

概率的公理

非负性：对于任何事件 $ A $，有 $ P(A) \geq 0 $。
归一性：样本空间的概率为 1，即 $ P(S) = 1 $。
可列可加性：如果事件 $ A_1, A_2, \ldots $ 两两互斥，那么

P\left(\bigcup_{i=1}^{\infty} A_i\right) = \sum_{i=1}^{\infty} P(A_i)

对初学者最常见的两个互斥事件 $ A $ 和 $ B $，上式可写成 $ P(A \cup B) = P(A) + P(B) $。

10.2 条件概率与独立性

条件概率

条件概率是指在事件 $ B $ 已经发生的条件下事件 $ A $ 发生的概率，记作 $ P(A|B) $：

P(A|B) = \frac{P(A \cap B)}{P(B)}

条件概率的前提是 $ P(B) > 0 $。

独立性

事件 $ A $ 和事件 $ B $ 是独立的，当且仅当 $ P(A \cap B) = P(A) \cdot P(B) $。
对于独立事件 $ A $ 和 $ B $，有 $ P(A|B) = P(A) $ 和 $ P(B|A) = P(B) $。

10.3 随机变量与分布

随机变量

随机变量是一个将样本空间的每个结果映射到实数的函数。随机变量可以是离散的或连续的。
- 离散随机变量：取有限个或可数无限个值。例如，掷骰子的点数。
- 连续随机变量：可以取任意实数值。例如，人的身高。

概率分布

离散概率分布：描述离散随机变量的每个可能值及其对应的概率。例如，掷骰子的概率分布是：

P(X = x) = \frac{1}{6} \quad \text{对于} \ x \in \lbrace 1, 2, 3, 4, 5, 6 \rbrace

连续概率分布：通过概率密度函数（PDF）来描述。例如，正态分布的概率密度函数为：

f(x) = \frac{1}{\sqrt{2 \pi \sigma^2}} e^{-\frac{(x - \mu)^2}{2 \sigma^2}}

其中，$ \mu $ 是均值，$ \sigma^2 $ 是方差。

期望与方差

期望（Expected Value）：随机变量的加权平均值，表示随机变量的中心位置。离散随机变量的期望计算为：

E(X) = \sum_{i} x_i \cdot P(X = x_i)

连续随机变量的期望计算为：

E(X) = \int_{-\infty}^{\infty} x \cdot f(x) , dx

方差（Variance）：随机变量与其期望值之间的平方差的期望，表示随机变量的离散程度。计算公式为：

\text{Var}(X) = E[(X - E(X))^2]

方差的平方根称为标准差（Standard Deviation）。

10.4 常见概率分布

离散分布

伯努利分布：描述只有两个可能结果（成功或失败）的随机实验。概率质量函数为：

P(X = 1) = p, \quad P(X = 0) = 1 - p

二项分布：描述进行 $ n $ 次独立伯努利试验中成功的次数。概率质量函数为：

P(X = k) = \binom{n}{k} p^k (1 - p)^{n - k}

泊松分布：描述单位时间或单位空间内事件发生的次数。概率质量函数为：

P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}

连续分布

均匀分布：描述随机变量在某一范围内均匀分布。概率密度函数为：

f(x) = \frac{1}{b - a}, \quad \text{对于} \ a \leq x \leq b

正态分布：描述许多自然现象的分布，形状为钟形曲线。其概率密度函数为：

f(x) = \frac{1}{\sqrt{2 \pi \sigma^2}} e^{-\frac{(x - \mu)^2}{2 \sigma^2}}

指数分布：描述事件之间的时间间隔。概率密度函数为：

f(x) = \lambda e^{-\lambda x}, \quad \text{对于} \ x \geq 0

10.5 大数法则与中心极限定理

大数法则

大数法则表明，当进行大量独立的随机实验时，样本均值会趋近于期望值。常见的形式有弱大数法则和强大数法则。

中心极限定理

中心极限定理表明，对于独立同分布的随机变量，其和的分布趋近于正态分布，即使原始分布不是正态分布。这在样本量足够大的情况下尤其适用。

例子

实际应用：在金融市场中，中心极限定理可以用来估计资产收益的分布。
调查研究：在社会科学调查中，大数法则用于预测样本均值接近总体均值。

10.6 这章在经济学里回答什么问题

问题 1：未来有不确定性时怎么分析选择

概率论让你能讨论风险、预期收益、保险、投资组合和预期效用。

问题 2：样本里看到的波动有多大可能只是随机结果

这为后面的统计推断、假设检验和计量模型打基础。

问题 3：面对重复随机事件，长期平均会怎样

大数法则和中心极限定理解释了为什么样本平均、估计量和市场经验规律有分析价值。

概率论是分析随机现象的基础，广泛应用于统计学、金融、工程、科学研究等领域。掌握概率论的基本概念和定理对于理解和解决实际问题非常重要。

Hello Economics