随机变量(Random Variable)是把随机试验的 每一个可能结果 都对应到一个 实数 的函数,通常用大写字母 X,Y,Z 表示,其取值用对应的小写字母 x,y,z 表示。
按取值的形式可分为 2 类:
| 类型 | 定义 | 示例 |
|---|
| 离散型随机变量 | 取值可以 一一列出(有限或可数无限) | 掷骰子点数 X∈{1,2,…,6} |
| 连续型随机变量 | 取值充满 某个区间 | 测量身高、温度的值(实数区间) |
高中阶段重点学 离散型 随机变量及其分布列;连续型 主要在 正态分布 一节出现。
设离散型随机变量 X 所有可能取值为 x1,x2,…,xn,对应的概率为 pi=P(X=xi)。下表称为 X 的 分布列(也称 概率分布):
| X | x1 | x2 | ⋯ | xn |
|---|
| P | p1 | p2 | ⋯ | pn |
分布列必须满足两条性质:
- 非负性:pi≥0 (i=1,2,…,n)。
- 归一性:i=1∑npi=1。
「归一性」是检验分布列是否正确的最直接手段——所有概率之和必须等于 1。
掷一枚均匀骰子,记朝上点数为 X,则其分布列为:
| X | 1 | 2 | 3 | 4 | 5 | 6 |
|---|
| P | 61 | 61 | 61 | 61 | 61 | 61 |
数学期望(Expectation)反映随机变量取值的 平均水平,记作 E(X) 或 μ。
对离散型随机变量:
E(X)=i=1∑nxipi
期望的性质(a,b 为常数,X,Y 为随机变量):
- E(c)=c(常数的期望是其本身)
- E(aX+b)=aE(X)+b(线性性)
- E(X+Y)=E(X)+E(Y)(可加性,无条件成立)
- 当 X,Y 相互独立 时,E(XY)=E(X)E(Y)
方差(Variance)反映随机变量取值的 离散程度,记作 D(X) 或 σ2。
D(X)=i=1∑n(xi−E(X))2pi=E(X2)−[E(X)]2
标准差 记作 σ(X)=D(X),与原数据 同量纲。
方差的性质:
- D(c)=0
- D(aX+b)=a2D(X)(注意是 a2 而不是 a,且常数 b 不影响方差)
- 当 X,Y 相互独立 时,D(X±Y)=D(X)+D(Y)(注意是「加」不是「减」)
「方差不变常数项,平方系数倍率」——D(aX+b) 与 b 无关,只放大 a2 倍。
期望与方差是新高考概率大题的 得分核心,公式必须熟记。
| 分布 | 记号 | E(X) | D(X) |
|---|
| 两点分布(伯努利) | B(1,p) | p | p(1−p) |
| 二项分布 | B(n,p) | np | np(1−p) |
| 超几何分布 | H(N,K,n) | NnK | N2(N−1)nK(N−K)(N−n) |
| 正态分布 | N(μ,σ2) | μ | σ2 |
设 X∼B(10,0.6),则 E(X)=10×0.6=6,D(X)=10×0.6×0.4=2.4。
我们把只包含 两个 可能结果的试验叫做 伯努利试验,独立地重复进行 n 次所组成的随机试验称为 n 重伯努利试验。
在 n 重伯努利试验中,设每次试验中事件 A 发生的概率为 p,发生的次数为 X,则有:
P(X=k)=Cnkpk(1−p)n−k
如果随机变量 X 的分布列具有上式的形式,则称随机变量 X 服从 二项分布,记作:
X∼B(n,p)
由 二项式定理,容易得到:
k=0∑nP(X=k)=k=0∑nCnkpk(1−p)n−k=[p+(1−p)]n=1
超几何分布:假设一批产品共 N 件,其中有 M≤N 件次品。从 N 件产品中随机不放回抽取 n≤N 件,用 X 表示抽取的次品数,则有:
P(X=k)=CNnCMkCN−Mn−k
E(X)=NnM,D(X)=N2(N−1)nM(N−M)(N−n)
与二项分布相比,超几何分布更集中在均值附近。
正态分布(高斯分布)是一种 连续 的概率分布,可以看作二项分布的极限情况。
正态分布的解析式:
f(x)=σ2π1e−2σ2(x−μ)2
其中 μ∈R,σ>0 为参数。对 ∀x∈R,f(x)>0,可以用积分证明 x 轴与曲线之间的区域面积为 1。称 f(x) 为正态密度函数,图像为正态(密度)曲线。X 服从正态分布,记为:
X∼N(μ,σ2)
E(X)=μ,D(X)=σ2
特别地,当 μ=0,σ=1 时称 X 服从标准正态分布。
正态分布的特点:
- 曲线是单峰的,关于 x=μ 对称;在 x=μ 达到峰值 σ2π1。
- lim∣x∣→∞f(x)=0。
- 当 σ 较小时,曲线瘦高,反之矮胖。
常用取值:
P(μ−σ≤X≤μ+σ)≈0.6827
P(μ−1.96σ≤X≤μ+1.96σ)=0.95
P(μ−2σ≤X≤μ+2σ)≈0.9545
P(μ−2.58σ≤X≤μ+2.58σ)=0.99
P(μ−3σ≤X≤μ+3σ)≈0.9973
3σ 原则:服从于正态分布 N(μ,σ2) 的随机变量通常只取 [μ−3σ,μ+3σ] 之间的值。