什么是随机变量?
在代数中,你可能还记得使用像“ ”或“ ”这样的变量,它们代表一个未知量,例如 。你会解出 x 的值,因此 x 代表一个特定的数字(或者如果你讨论的是函数,它可能代表一组数字)。当你进入统计学领域时,会使用不同类型的变量,包括随机变量。这些变量仍然是数量,但与代数中的“x”或“y”(它们只是单纯的数字)不同,随机变量具有独特的特征和行为:
- 随机变量用大写字母表示。如果你看到小写的 x 或 y,那就是你在代数中熟悉的那种变量,指的是一个未知的数量或多个数量。如果你看到大写的 X 或 Y,那就是一个随机变量,通常指获得某种结果的概率。
- 随机变量与随机过程相关联。
随机过程是指具有随机结果的事件或实验。例如:掷骰子、抽一张牌、抽取一个宾果球、玩老虎机,或者成千上万种其他可能性中的任意一种。这是一种你无法准确预测其结果的事情;你可能会有一系列可能的结果,因此会计算某个特定结果发生的概率。 - 随机变量为随机事件的结果赋予数值。随机变量在数值意义上与 x 或 y 相同,但它是附属于一个随机事件的。
离散型与连续型随机变量
随机变量可以是离散的或连续的。
离散型随机变量具有以下性质:
- 可能取值的数量是可数的;
- 每个取值的概率介于 0 和 1 之间;
- 所有概率之和等于 1。用求和符号表示,若离散型随机变量的概率质量函数为 ,则满足:
连续型随机变量具有类似但不同的性质:
- 可能取值的数量是无限的;
- 每个具体取值的概率为 0(例如,如果你能以无限精度测量身高,那么几乎不可能找到另一个活着的人具有完全相同的身高);
- 曲线下的面积(即不定积分)等于 1。若 是 X 的概率密度函数(pdf),则有:
随机事件示例
掷骰子是一个随机事件,你可以对结果进行量化(即赋予一个数字)。假设你想知道在掷若干次骰子时会出现多少次“6”。你可以定义随机变量 X:当掷出 6 时 X = 1,掷出其他数字时 X = 0。
这只是一个例子;你可以按自己的意愿定义 X 和 Y(例如,掷出 6 时 X = 2,否则 X = 9)。
以下是更多随机变量的例子:
- X = 彩票号码的总和。
- Y = 停车场中空闲停车位的数量。
- Z = 一手牌中 A 的数量。
随机事件的概率
随机变量最常与随机事件发生的概率结合使用。假设你想判断在玩扑克时,一手牌中拿到四张 A 的概率是否小于 5%。你可以写成:
P(从 52 张牌中发 4 张牌时拿到四张 A 的概率 < 0.05)
这种写法非常冗长,尤其是需要反复书写时。如果你定义随机变量 X 为“拿到四张 A”,即:
X = 从 52 张牌中发 4 张牌时拿到四张 A 的事件
那么你就可以简洁地写作:
P(X < 0.05)
这类似于计算机编程中的变量定义:你在编程语言中定义变量,以便后续计算可以引用这些变量。好消息是,在基础统计学或 AP 统计学中,随机变量通常已经为你定义好了,你不需要自己定义。
在基于微积分的统计学中,随机变量的概率可以用定积分来定义 [2]:
X 落在区间 内的概率为:
其中 是 X 的概率密度函数(pdf)。
随机变量的均值与众数
离散型随机变量的均值(期望值)
离散型随机变量的均值是其取值的加权平均,公式为:
换句话说,将每个可能的取值乘以其对应的概率,然后全部相加。
连续型随机变量的均值
对于连续型随机变量,没有简单的通用公式来求均值。你需要查阅该变量所服从的概率分布的具体公式。例如:
- 正态分布的均值是曲线的中心;
- 均匀分布的均值是 。
连续型随机变量的众数
对于具有概率密度函数 的连续型随机变量,其众数可通过优化方法找到:令导数为零。具体来说,众数是 的局部最大值点,满足一阶导数为零且二阶导数小于或等于零。用导数符号表示,即任意满足以下条件的点 x:
随机变量的方差
离散型随机变量的方差公式:
注:这也是 AP 统计学中的一个标准公式。
- (求和符号)表示“把所有项加起来”;
- = 期望值(均值);
- = 随机变量的取值;
- 是该取值的概率(用函数表示法)。有时你也可能看到用 代替 ,但含义相同。
随机变量方差的计算步骤
例题:某工厂每生产 100 个披萨,就会有一定数量的变形披萨。下表给出了变形披萨数量的概率分布数据。求随机变量 X 的方差。
| x(变形披萨数) | 2 | 3 | 4 | 5 | 6 |
|---|---|---|---|---|---|
| f(x)(概率) | 0.01 | 0.25 | 0.4 | 0.3 | 0.04 |
步骤 1:计算均值 :
步骤 2:使用方差公式:
因此,该随机变量的方差为 0.74。
示例 2:离散型随机变量的方差(概率表)
问题:根据下表数据,求股票涨幅百分比的方差。表中给出了三种不同涨幅及其对应概率:
| 股票涨幅(X) | -4.00% | 5.00% | 16.00% |
|---|---|---|---|
| 概率 p | 0.22 | 0.43 | 0.35 |
步骤 1:计算期望值(即分布的均值):
步骤 2:从每个 X 值中减去均值,然后平方:
步骤 3:将步骤 2 的结果乘以其对应的概率:
步骤 4:将步骤 3 的结果相加:
因此,方差为 56.67%(注意:这是以百分比平方为单位的方差)。
连续型随机变量的方差
可以使用微积分计算连续型随机变量的方差。
连续型随机变量方差的公式为以下积分:
二项随机变量
二项随机变量是指在二项实验中成功次数的计数。
在适当条件下,掷骰子可以构成一个二项实验。
要使一个变量被归类为二项随机变量,必须同时满足以下条件:
- 试验次数固定(即有确定的样本量);
- 每次试验只有两种可能结果:成功或失败;
- 每次试验中成功的概率完全相同;
- 各次试验相互独立。
二项随机变量的示例:
- 抛一枚公平硬币 30 次,正面朝上的次数;
- 购买 20 张同类型刮刮乐彩票,中奖的张数;
- 在 200 人的随机样本中,右撇子的人数;
- 回答“是”的人数(例如:“你是否在 2012 年投票给奥巴马?”);
- 在 40 名星巴克顾客的样本中,更喜欢店内咖啡而非星冰乐的人数。
二项分布的两个重要特征(二项随机变量服从二项分布):
- = 固定的试验次数;
- = 每次试验成功的概率。
例如:抛硬币 10 次,看出现多少次正面: , (因为正面出现的概率是 50%)。
小贴士:
- 如果你不是在计数某件事发生的次数,那它就不是二项随机变量。
- 实验中的试验次数必须是固定的。例如,“在掷出 3 之前掷骰子的次数”不是二项随机变量,因为试验次数不确定。但“掷骰子 30 次,记录出现 3 的次数”是二项随机变量。
概率分布与累积分布函数(CDF)
连续型随机变量的概率密度函数(PDF)可通过积分来描述:
该 PDF 满足以下两个性质:
- (即 不能为负);
- (即曲线下面积等于 1)。
然而,PDF 本身并不能直接告诉我们具体的概率值(例如 或 )。为此,我们需要另一个公式。对于连续型随机变量,事件 的概率可通过以下积分计算 [2]:
其中 是概率密度函数(PDF)。
由于这是一个积分,因此任何一个特定结果的概率为零这一点就很容易理解了。另一种思考方式是:如果你以无限精度测量一辆汽车的长度,那么另一辆汽车恰好具有完全相同长度的概率为零。
累积分布函数(CDF)定义为如下积分: