![统计学关我什么事:生活中的极简统计学](https://wfqqreader-1252317822.image.myqcloud.com/cover/417/22394417/b_22394417.jpg)
1-3 第二步:设置发生“向店员询问”事件的条件概率
在这一步,我们要做的是:为“来买东西的人”和“随便逛逛的人”这两类顾客分别设定“向店员询问”的概率。如果没有相关经验和数据作为支撑,这项工作是无法完成的。上一节讲到,即使没有相关经验,也可以设定先验概率。但此处的“各个分类的行动概率”,必须是基于一定的经验、实证、实验的数值。
图表1-2中的数值,是为了计算简便而设定的,并非真实数据。
图表1-2 关于“向店员询问”这一行为的条件概率
![](https://epubservercos.yuewen.com/5992F3/10987229503597206/epubprivate/OEBPS/Images/figure_0018_0001.jpg?sign=1739424280-EL1jyfPDLV2gqDhuc5almxKWw2Zyza0G-0-5e123d4e190314de077b3ed49a532044)
从图表1-2中可以看出,“来买东西的”顾客向店员询问的概率是0.9,而“随便逛逛的”顾客向店员询问的概率只有0.3。
需要注意的是:图表1-2从横向来看,0.9+0.1=1,0.3+0.7=1,两行都满足标准化条件;而纵向来看,0.9+0.3≠1,也就是说并不满足标准化条件。具体分析一下:横向的一行,表示某一类别的顾客可能采取的两种行动。比如第一行数字,表示“来买东西的人”向店员“询问”或“不询问”这两种行为,顾客有可能询问,也有可能不询问,最终采取的行动一定是其中之一,没有第三种可能性。而纵向来看,第一列数字表示,“来买东西的人”向店员询问的概率为0.9,“随便逛逛的人”向店员询问的概率为0.3,两个数字相加之和并不等于1。这是因为,对象范围包含了两个不同类别的顾客,并且也没有涵盖所有的行动。
图表1-2中的数字,表示“某一特定类别采取各种行动的概率”,这在高等数学中被称为“条件概率”。用“原因”的概念来解释,即“在原因明确的情况下,某一类别采取各项行动的结果概率”(第15讲中将介绍:如何用符号来表示条件概率)。
将两个类别的顾客,进一步按照“询问”和“不询问”的条件来分类,那么前文所述的两个大类别又可以细分为四个小类别,分别是:“来买东西的人询问店员”“随便逛逛的人询问店员”“来买东西的人不询问店员”“随便逛逛的人不询问店员”,如图表1-3所示。
图表1-3 四种互不相同的可能性
![](https://epubservercos.yuewen.com/5992F3/10987229503597206/epubprivate/OEBPS/Images/figure_0019_0001.jpg?sign=1739424280-9u6FULeXA8rRve1GX0OlBq7qO2IHcb0J-0-d0265ff2a23a6920cca1051a6f67081e)
一共存在四种可能性:来买东西的人询问店员(左上区域)、来买东西的人不询问店员(左下区域)、随便逛逛的人询问店员(右上区域)、随便逛逛的人不询问店员(右下区域)。概率的具体计算方法将在第10讲中具体介绍,此处对于结论先进行说明:各个区域所表示的概率与每个长方形的面积相等。长方形的面积可以用乘法求得,如图表1-4所示。
图表1-4 四种互不相同的可能性各自所对应的概率
![](https://epubservercos.yuewen.com/5992F3/10987229503597206/epubprivate/OEBPS/Images/figure_0020_0001.jpg?sign=1739424280-g0R2gxl0VvxGoKoQBMI5MJY73zm5I0zh-0-4506718c9535eca582d6b4c361885c80)
下面我们来确认一下,这四个“可能世界”(所有可能发生的情况)的概率之和:
0.2×0.9=0.18 0.2×0.1=0.02
0.8×0.3=0.24 0.8×0.7=0.56
(0.18+0.02)+(0.24+0.56)=1