似然 极大似然估计

似然是likelihood的近文言文的翻译,现代中文可以叫可能性。
已知结果,倒推可能的参数,就叫做似然。
最有可能(似然函数最大化)造成这种结果的原因(一组参数)就叫做最大似然估计。这个原因(参数)造成这种结果在所有原因(参数)中概率是最大的。
已知参数求某种结果发生的几率就叫做概率。

最大似然估计主要用于多次试验。
一次实验最大似然估计,就是观察到的概率,比如抛10次硬币,观察到6次花,那么参数抛1次硬币得到花的概率就是6/10,这和极大似然估计是相同的(人类自带极大似然估计,只有概率是0.6的时候,这种情况的几率更大)。

以前我同事说的一句话,是否是对的?一次(系列)实验中观察到的即最大(一次实验中能观察到,说明概率很大,概率最大的时候参数是多少,我觉得是有问题的,比如生病发烧与否,原因有新冠、感冒、骨质增生,发烧的概率分别是10%、30%、1%,现在生病发烧了,假设只能生这三种病之一,那实际上不发烧的概率更大,所以说一次实验中能观察到,说明概率很大就不对,假设概率很大解释起来也没有上面的定义好,所以我同事的说法不对)。

对于我们建模的时候有10000条记录的问题,这个问题中一次实验是什么?这个问题的一次实验就是每一条记录,这个实验可以是来一个客户,他是好人还是坏人?自变量就是向量X,系数θ就是参数,所以对于第一个人X1是坏人,发生的概率就是P1=F(X1,θ),以此类推,最后把P1、P2...Pm连乘起来得到似然函数,观察到这种结果,最有可能的参数是多少?
在那个θ下,发生这个结果的概率最大。

头痛那个例子,实验就可以定义成:生病观察是否头痛。观察到头痛了,这个时候参数病种就3选1感冒最大!
实验肯定是随机事件,所以不存在必然头痛的说法,必然头痛还观察个屁呀。


留言

熱門文章