随机变量:统计学中的定义

更新于 2026-02-05

什么是随机变量?

在代数中,你可能还记得使用像“ xx ”或“ yy ”这样的变量,它们代表一个未知量,例如 y=x+1y = x + 1 。你会解出 x 的值,因此 x 代表一个特定的数字(或者如果你讨论的是函数,它可能代表一组数字)。当你进入统计学领域时,会使用不同类型的变量,包括随机变量。这些变量仍然是数量,但与代数中的“x”或“y”(它们只是单纯的数字)不同,随机变量具有独特的特征和行为:

  • 随机变量用大写字母表示。如果你看到小写的 x 或 y,那就是你在代数中熟悉的那种变量,指的是一个未知的数量或多个数量。如果你看到大写的 X 或 Y,那就是一个随机变量,通常指获得某种结果的概率。
  • 随机变量与随机过程相关联
    image 随机过程是指具有随机结果的事件或实验。例如:掷骰子、抽一张牌、抽取一个宾果球、玩老虎机,或者成千上万种其他可能性中的任意一种。这是一种你无法准确预测其结果的事情;你可能会有一系列可能的结果,因此会计算某个特定结果发生的概率。
  • 随机变量为随机事件的结果赋予数值。随机变量在数值意义上与 x 或 y 相同,但它是附属于一个随机事件的。

离散型与连续型随机变量

随机变量可以是离散的连续的

离散型随机变量具有以下性质:

  • 可能取值的数量是可数的
  • 每个取值的概率介于 0 和 1 之间;
  • 所有概率之和等于 1。用求和符号表示,若离散型随机变量的概率质量函数为 m(x)=P(X=x)m(x) = \mathbb{P}(X = x),则满足:xm(x)=1\sum_{x} m(x) = 1

连续型随机变量具有类似但不同的性质:

  • 可能取值的数量是无限的
  • 每个具体取值的概率为 0(例如,如果你能以无限精度测量身高,那么几乎不可能找到另一个活着的人具有完全相同的身高);
  • 曲线下的面积(即不定积分)等于 1。若 fXf_X 是 X 的概率密度函数(pdf),则有:fX(x)dx=1\int_{-\infty}^{\infty} f_X(x) \, dx = 1

随机事件示例

掷骰子是一个随机事件,你可以对结果进行量化(即赋予一个数字)。假设你想知道在掷若干次骰子时会出现多少次“6”。你可以定义随机变量 X:当掷出 6 时 X = 1,掷出其他数字时 X = 0。

这只是一个例子;你可以按自己的意愿定义 X 和 Y(例如,掷出 6 时 X = 2,否则 X = 9)。

以下是更多随机变量的例子:

  • X = 彩票号码的总和。
  • Y = 停车场中空闲停车位的数量。
  • Z = 一手牌中 A 的数量。

随机事件的概率

随机变量最常与随机事件发生的概率结合使用。假设你想判断在玩扑克时,一手牌中拿到四张 A 的概率是否小于 5%。你可以写成:

P(从 52 张牌中发 4 张牌时拿到四张 A 的概率 < 0.05)

这种写法非常冗长,尤其是需要反复书写时。如果你定义随机变量 X 为“拿到四张 A”,即:

X = 从 52 张牌中发 4 张牌时拿到四张 A 的事件

那么你就可以简洁地写作:

P(X < 0.05)

这类似于计算机编程中的变量定义:你在编程语言中定义变量,以便后续计算可以引用这些变量。好消息是,在基础统计学或 AP 统计学中,随机变量通常已经为你定义好了,你不需要自己定义。

在基于微积分的统计学中,随机变量的概率可以用定积分来定义 [2]:

X 落在区间 [a,b][a, b] 内的概率为:

P(aXb)=abfX(x)dx\mathbb{P}(a \leq X \leq b) = \int_a^b f_X(x) \, dx

其中 fXf_X 是 X 的概率密度函数(pdf)。


随机变量的均值与众数

离散型随机变量的均值(期望值)

离散型随机变量的均值是其取值的加权平均,公式为:

μX=x1p1+x2p2++xnpn=xipi\mu_X = x_1 p_1 + x_2 p_2 + \dots + x_n p_n = \sum x_i p_i

换句话说,将每个可能的取值乘以其对应的概率,然后全部相加。

连续型随机变量的均值

对于连续型随机变量,没有简单的通用公式来求均值。你需要查阅该变量所服从的概率分布的具体公式。例如:

  • 正态分布的均值是曲线的中心;
  • 均匀分布的均值是 b+a2\frac{b + a}{2}

连续型随机变量的众数

对于具有概率密度函数 fXf_X 的连续型随机变量,其众数可通过优化方法找到:令导数为零。具体来说,众数是 fXf_X 的局部最大值点,满足一阶导数为零且二阶导数小于或等于零。用导数符号表示,即任意满足以下条件的点 x:

fX(x)=0fX(x)0f'_X(x) = 0 \quad \text{且} \quad f''_X(x) \leq 0

随机变量的方差

离散型随机变量的方差公式:

σ2=(xiμ)2f(x)\sigma^2 = \sum (x_i - \mu)^2 f(x)

注:这也是 AP 统计学中的一个标准公式。

  • Σ\Sigma (求和符号)表示“把所有项加起来”;
  • μ\mu = 期望值(均值);
  • xix_i = 随机变量的取值;
  • f(x)f(x) 是该取值的概率(用函数表示法)。有时你也可能看到用 PiP_i 代替 f(x)f(x),但含义相同。

随机变量方差的计算步骤

例题:某工厂每生产 100 个披萨,就会有一定数量的变形披萨。下表给出了变形披萨数量的概率分布数据。求随机变量 X 的方差。

x(变形披萨数) 2 3 4 5 6
f(x)(概率) 0.01 0.25 0.4 0.3 0.04

步骤 1:计算均值 μ\mu

μ=2×0.01+3×0.25+4×0.4+5×0.3+6×0.04=0.02+0.75+1.6+1.5+0.24=4.11\begin{align*} \mu &= 2 \times 0.01 + 3 \times 0.25 + 4 \times 0.4 + 5 \times 0.3 + 6 \times 0.04 \\ &= 0.02 + 0.75 + 1.6 + 1.5 + 0.24 \\ &= 4.11 \end{align*}

步骤 2:使用方差公式:

σ2=(xiμ)2f(x)\sigma^2 = \sum (x_i - \mu)^2 f(x) =(24.11)2×0.01+(34.11)2×0.25+(44.11)2×0.4+(54.11)2×0.3+(64.11)2×0.040.74\begin{align*} &= (2 - 4.11)^2 \times 0.01 \\ &+ (3 - 4.11)^2 \times 0.25 \\ &+ (4 - 4.11)^2 \times 0.4 \\ &+ (5 - 4.11)^2 \times 0.3 \\ &+ (6 - 4.11)^2 \times 0.04 \\ &\approx 0.74 \end{align*}

因此,该随机变量的方差为 0.74


示例 2:离散型随机变量的方差(概率表)

问题:根据下表数据,求股票涨幅百分比的方差。表中给出了三种不同涨幅及其对应概率:

股票涨幅(X) -4.00% 5.00% 16.00%
概率 p 0.22 0.43 0.35

步骤 1:计算期望值(即分布的均值):

μ=(4.00%×0.22)+(5.00%×0.43)+(16.00%×0.35)=0.88%+2.15%+5.6%=6.87%\mu = (-4.00\% \times 0.22) + (5.00\% \times 0.43) + (16.00\% \times 0.35) = -0.88\% + 2.15\% + 5.6\% = 6.87\%

步骤 2:从每个 X 值中减去均值,然后平方:

(4.00%6.87%)2=(10.87%)2=118.1569(5.00%6.87%)2=(1.87%)2=3.4969(16.00%6.87%)2=(9.13%)2=83.3569\begin{align*} (-4.00\% - 6.87\%)^2 &= (-10.87\%)^2 = 118.1569 \\ (5.00\% - 6.87\%)^2 &= (-1.87\%)^2 = 3.4969 \\ (16.00\% - 6.87\%)^2 &= (9.13\%)^2 = 83.3569 \\ \end{align*}

步骤 3:将步骤 2 的结果乘以其对应的概率:

118.1569×0.22=25.99453.4969×0.43=1.503783.3569×0.35=29.1749\begin{align*} 118.1569 \times 0.22 &= 25.9945 \\ 3.4969 \times 0.43 &= 1.5037 \\ 83.3569 \times 0.35 &= 29.1749 \\ \end{align*}

步骤 4:将步骤 3 的结果相加:

25.9945+1.5037+29.1749=56.67%25.9945 + 1.5037 + 29.1749 = 56.67\%

因此,方差为 56.67%(注意:这是以百分比平方为单位的方差)。


连续型随机变量的方差

可以使用微积分计算连续型随机变量的方差。

连续型随机变量方差的公式为以下积分:

σ2=(xμ)2f(x)dx\sigma^2 = \int_{-\infty}^{\infty} (x - \mu)^2 f(x) \, dx

二项随机变量

二项随机变量是指在二项实验中成功次数的计数。

img 在适当条件下,掷骰子可以构成一个二项实验。

要使一个变量被归类为二项随机变量,必须同时满足以下条件:

  1. 试验次数固定(即有确定的样本量);
  2. 每次试验只有两种可能结果:成功失败
  3. 每次试验中成功的概率完全相同
  4. 各次试验相互独立

二项随机变量的示例:

  • 抛一枚公平硬币 30 次,正面朝上的次数;
  • 购买 20 张同类型刮刮乐彩票,中奖的张数;
  • 在 200 人的随机样本中,右撇子的人数;
  • 回答“是”的人数(例如:“你是否在 2012 年投票给奥巴马?”);
  • 在 40 名星巴克顾客的样本中,更喜欢店内咖啡而非星冰乐的人数。

二项分布的两个重要特征(二项随机变量服从二项分布):

  • nn = 固定的试验次数;
  • pp = 每次试验成功的概率。

例如:抛硬币 10 次,看出现多少次正面: n=10n = 10p=0.5p = 0.5 (因为正面出现的概率是 50%)。

小贴士:

  • 如果你不是在计数某件事发生的次数,那它就不是二项随机变量。
  • 实验中的试验次数必须是固定的。例如,“在掷出 3 之前掷骰子的次数”不是二项随机变量,因为试验次数不确定。但“掷骰子 30 次,记录出现 3 的次数”二项随机变量。

概率分布与累积分布函数(CDF)

连续型随机变量的概率密度函数(PDF)可通过积分来描述:

P(cXd)=cdf(x)dx\mathbb{P}(c \leq X \leq d) = \int_c^d f(x) \, dx

该 PDF f(x)f(x) 满足以下两个性质:

  • f(x)0f(x) \geq 0 (即 ff 不能为负);
  • f(x)dx=1\int f(x) \, dx = 1 (即曲线下面积等于 1)。

然而,PDF 本身并不能直接告诉我们具体的概率值(例如 P(X<5)P(X < 5)P(X=6)P(X = 6) )。为此,我们需要另一个公式。对于连续型随机变量,事件 XX 的概率可通过以下积分计算 [2]:

P(XA)=xAf(x)dx\mathbb{P}(X \in A) = \int_{x \in A} f(x) \, dx

其中 f(x)f(x) 是概率密度函数(PDF)。

由于这是一个积分,因此任何一个特定结果的概率为零这一点就很容易理解了。另一种思考方式是:如果你以无限精度测量一辆汽车的长度,那么另一辆汽车恰好具有完全相同长度的概率为零。

累积分布函数(CDF)定义为如下积分:

F(x)=f(t)dtF(x) = \int_{-\infty}^{\infty} f(t) \, dt