1.样本空间
注意:第一卷只涉及“离散样本空间”,而第二卷才讲“连续样本空间”
1. 经验背景
概率论的数学理论,与许多实际的和理想的实验相联系,或结合一些生活现象,便获得了实用的价值和直观的意义
这里所谓实际的和理想的实验,例如有:扔 1 次硬币;扔 100 次硬币;掷3颗骰子;理一副纸牌;用两副纸牌对点1;玩轮盘赌;
观察放射性原子的寿命或观察人的寿命;以人为随机样本而观察其中左撇子的人数;将两种作物杂交而观察它们后代的遗传型.
所谓生活现象,例如有:初生儿的性别;电话交换中被占用的通话线路的数目;电话的来电次数;在电讯系统里面的随机噪声;
生产过程的例行质量控制;意外事故的频率;天空某一区域内双星的个数;在扩散过程中一个质点的位置
上列各项描述是含糊了一点,要使概率论有意义,我们还必须一同明确所探讨的实验或观察的可能结果究竟是指什么,
任何理论都必然含有理想化,对于我们来说,第一个理想化是关于“实验”或“观察”的可能结果.如果我们要为实验制作一个抽象模型,我们必须一开始就作出决定:这(理想的)实验的可能结果是由哪些东西构成的
事件
事件:实验或观察的结果
- 复合事件:可以被分解的事件,如:“两次掷骰子,骰子点数总和为6”,“两次掷骰子,有两个奇数点”,“此人60多岁”
- 简单事件(样本点 / 点):不可被分解的事件,如:“两次掷骰子,结果是(3,3)”,“此人65岁”
注:简单事件代表可以想象的结果,我们用它们来定义理想的实验(换句话说,这种简单事件是不定义的,犹如几何中的点和线是不定义的一样)
样本空间:所有的样本点的集合
2. 例子
- 3 个球在 3 个盒中的分布
- r 个球在 n 个盒中的分布(16 种等价的案例详见 p13)
- r 个球在 n 个盒中的分布,r 个球不可辨别(或者球不可辨别更方便处理;“波斯-爱因斯坦统计”);或者盒子也是不可辨别的
- 抽样,如:以 100 个人作为样本,我们只关注抽烟者的人数 x(\(x=0..100\),总共 101 个“点”)
- 抽样,如:以 100 个人作为样本,我们关注号抽烟者的人数和性别,那么每个样本点可以用四元组 \((M_s,F_s,M_n,F_n)\)(\(M_s+F_s+M_n+F_n=100\))来描述
- 扔硬币:扔 3 次硬币
- 夫妇的年龄:每次考察可以得到一个数对 \((x,y)\),分别表示丈夫和妻子的年龄
- 相空间:统计力学例的每个可能的“状态”称为“相空间中的一个点”;其实相空间就是样本空间,它的点也就是样本点
3. 样本空间,事件
事件等同于样本点的一个集合
事件包含某些点(或由某些点构成),等同于 这些点在理想实验中能使 A 发生
事件,样本点分别等价于 点集,点
4. 事件之间的关系
概念
样本空间,记作 \(\mathfrak S\)
事件:样本点的集合,以大写字母表示,如 \(A,B\)
样本点:以小写字母表示,如 \(x\)
\(x\in A\):点 x 包含在时间 A 中
\(A=B\):事件 A 和 B 均由相同的点构成
定义
- 事件 A 不包含任何样本点(即是不可能事件),记作 \(A=0\)(\(0\notin\mathbb R\))
- 补事件(事件的非):样本空间中一切不属于事件 A 的点所构成的事件称为 A 的补(或 A 的非)事件,记作 \(A'\)(特别地,\(\mathfrak S'=0\))
- \(AB\):事件 A 和 B 同时发生
- \(\bigcap\limits_{i=1}^nA_i=A_1\cap\dots\cap A_n=A_1\dots A_n\):该事件属于全部给定的集合中的样本点的全体所组成,称之为 \(A_1\dots A_n\) 之交(同时实现)
- \(AB=0\):事件 A 和 B 相互排斥,因而 AB 是不可能事件,读作“A 和 B 互不相容”
- 两两互斥:对于所有 \(i\ne j\),\(A_iA_j=0\)
- \(A\cup B\):事件 A 或 B 发生,或同时发生;也即 A 和 B 至少有一个发生;它包含既不属于 A 又不属于 B 的点之外的所有样本点
- \(\bigcup\limits_{i=1}^nA_i=A_1\cup\dots\cup A_n\):称之为给定的各集合之并(至少有一个实现)
- \(A\subset B\) 或 \(B\supset A\):A 的每一个点都包含在 B 中,读作“A 蕴涵 B” 或 “B 被 A 蕴涵”
- \(B-A\) 或 \(BA'\):“B 发生而 A 不发生”(仅当 \(A\subset B\))
- 性质1:\(A'=\mathfrak S-A\),\(A-A=0\)
- 性质2:A 和 B 互不相容,当且仅当 A 发生蕴含着 B 不发生;换句话说 \(AB=0\),当且仅当 \(A\subset B'\) 或 \(B\subset A'\)
- 性质3:\(A-AB\) 表示 A 发生而非 A 和 B 同时发生,即 \(A-AB=AB'\)
5. 离散样本空间
离散样本空间
如果一个样本空间只包含有限多个点,或者虽有无穷多个点,而这些点可以排成一个简单的序列 \(E_1,E_2,\dots\) 的话,我们就说这个样本空间是离散的
在这本书里,我们只考虑离散的样本空间
6. 离散样本空间中概率的预备知识
各种事件的概率都是一些数值,这些数值的性质犹如几何学中的距离、力学中的质量,概率论假定概率的数值是给定的,但是关于它们的实在数值等于什么,怎样测量出来,却用不着作任何的假定
相同的样本空间中可以有不同的赋概法
7. 基本定义和规则
基本约定
给定一个含有样本点 \(E_1,E_2,\dots\) 的离散样本空间 \(\mathfrak S\),我们假定对每一个点 \(E_i\) 都赋予一个数,这个数称为 \(E_i\) 的概率,记为 \(P\{E_i\}\)
满足 \(P\{E_i\}\ge0\),并且 \(\sum P\{E_i\}=P\{E_1\}+P\{E_2\}+\dots=1\)
概率
任何一个事件 A 的概率 \(P(A)\) 是 A 中所包含的样本点的概率的总和,并且 \(0\le P\{A\}\le 1\)
注:\(P\{\mathfrak S\}=1\)
性质:\(P\{A_1\cup A_2\}=P\{A_1\}+P\{A_2\}-P\{A_1A_2\}\)(\(A_1\) 发生,或 \(A_2\) 发生,或 \(A_1,A_2\) 都发生的概率)
- \(P\{A_1\cup A_2\}\le P\{A_1\}+P\{A_2\}\)
- \(P\{A_1\cup A_2\}=P\{A_1\}+P\{A_2\}\),仅当 \(A_1A_2=0\)(\(A_1A_2\) 互斥)
- \(P\{\bigcup A_i\}=P\{A_1\cup A_2\cup\dots\}\le P\{A_1\}+P\{A_2\}+\dots\)(Boole 不等式)
- \(P\{\bigcup A_i\}=P\{A_1\cup A_2\cup\dots\}+ P\{A_1\}+P\{A_2\}+\dots\),仅当 \(A_1,A_2,\dots\) 互斥
Tip
在早期文献中,样本空间叫作“情形”,A 中的点叫作 “有利情形”(有利于 A),如果全部样本点的概率应用,则时间 A 的概率等于有利情形除以一切可能情形
不幸的是,这种叙述经常被滥用来作为概率的“定义”,即人们常常认为每一个有限的样本空间中的全部样本点的概率都是一样的;但是事实并非如此
譬如,一个不均匀硬币的样本空间只有两个点,但是它们可以具有任意的概率 p 和 q,使得 \(p+q=1\);一个新生儿可能是男孩,也可能是女孩,但是实际上它们的概率可以不一样
全部样本点的概率都一样的样本空间的用处几乎局限于研究 机会游戏 和 组合分析