中国高校SAS数据分析大赛2018宣讲会-华南赛区巡讲

迪奥成长营丨助您轻松拿下心动的offer(七)

生活中,知道一件事件的概率分布,能够让我们更看清事件的各种可能,根据分布的规律解决相关问题,有助于我们做出有利的决策。在机器学习领域,知道数据集的分布,有助于在建模过程中选择使用更合适的机器学习算法。


Q

常见的离散概率分布有:伯努利分布、二项分布、几何分布、泊松分布。您知道他们的分布特征和应用场景吗?能否说说这些分布在日常生活中的基本应用和相关现象?


伯努利分布

伯努利分布是指在同样条件下,重复的相互独立进行的一种随机性试验,每一次得到的结果只有两种,这种随机事件的概率分布。如抛硬币得到正面或者反面,做某件事情成功或者失败,病人康复或者不康复等等。


伯努利分布事件的结果用1和0表示,当结果等于1的概率为p时,结果等于0的概率为1-p。


二项分布

二项概率分布可以用于事件发生的次数是固定的,我们感兴趣的是成功的次数的概率,用二次分布就可以计算出我们感兴趣的概率。


应用场景:

1、购买6只股票,假设4只股票是上涨的就能保本,那么4只股票上涨的概率是多少?

2、一支篮球队需要和5支队伍PK,假设这支篮球队需要打赢3个队伍可以进入决赛,那么这支篮球队进入决赛的概率是多少?3、抛硬币5次,3次正面朝上的概率是多少?


二项分布的概率质量函数为:

n : 做某件事情的次数
p :一次事件成功的概率
k :成功的次数


二项分布

尝试某件事情多少次,才能取得第一次成功的概率是多少,例如:表白5次才能首次成功的概率是多少?这就是几何分布解决的问题。


二项分布的概率质量函数为:

p :做某件事情成功的概率
k :事件发生第k次才取得第1次成功


几何分布的期望为(预计事件发生多少次后才取得第1次成功):1/p,方差(数据波动的大小)为:(1-p)/p^2


泊松分布

想知道某个时间范围内发生某件事情k次的概率是多少,根据概率的大小做出决策。比如一段道路一天内发生交通事故的次数。这就是泊松分布解决的问题。


泊松分布的特征如下:
1、事件是独立事件
2、在任意相同的时间范围内,事件发生的概率相同
3、目的是想知道某个时间范围内,发生某件事情k次的概率是多少
当事件符合上面3个特点,那么这个事件就是服从泊松分布。


泊松分布的概率质量函数为:

 u : 给定时间范围内某件事情发生的平均次数
k :时间发生的次数
某件事情在时间范围内发生k次的泊松分布的期望和方差都是u


商务合作
BD@ibbd.net
简历投递
fuwu@ibbd.net
关于迪奥
产品中心
联系我们
行业应用
公司简介
新闻动态
人才招聘
自然语言理解
场景文字识别
文档OCR识别
金融行业
政府&公共事业
零售行业
020-29179586
工作日:9:30-18:30
广州市天河区华观路田头岗二路一横街起点国际三层
能源行业
文本数据挖掘