ref

生成模型与判别模型

cs229-notes

difference between generative and discriminative model

判决模型

判决模型有 2 种,一种是求解判决函数:

即给我一个样本集分类任务,设定判决函数 y=F(x),(如 SVM 平面分类),通过训练求解参数后,根据 F(x)直接可以预测 y,

另一种是直接求解$$P(y x)$$,注意并不是通过概率分布建模,比如 logistic 分类.
\[f(x)=arg\ \underset{y}{max} P(y|x)\]

learn p(y|x) directly,再理解下.

生成模型

生成模型,是先通过样本的统计情况求\(P(x,y)\),即联合概率.有了它,再结合 beyes 公式,也可以求得\(P(y|x)\) ,假设 y=j:

\[P(y=j|x)=\frac{P(x,y=j)}{P(x)}=\frac{P(y=j)P(x|y=j)}{\sum_{i}P(y_{i})*P(x|y_{i})}\]

给定预测 x 的时候,可知道它的概率 p(y|x),哪个概率(p(y=i|x))大,x 就属于哪个类. 同样可以得到分类结果.

上面公式是先估计$$P(x y)和P(x)\(. 对于\)P(x y)$$可以理解某个标签(y)对应的特征分布(x).

\(P(x)\)是样本的先验概率,在分类问题里,可以忽略.(其他问题,一定不能忽略)

再来理解 ng 里的例子:

生成模型: 先求大象(y=0)的特征分布,马(y=1)的特征分布,然后给出1个未知动物的特征(x),看其最符合哪个分布,就是什么动物(predict y).

判决模型: 根据现有训练集合,训练一个模型,之后给我特征,直接告诉你是什么动物.

参数估计

参数估计是统计意义.某个事情已经发生,去估计其发生的概率分布,或求解一个模型.模型可以用一些参数来描述,即\(f(x;\theta)\)

如何做参数估计,要了解频率学派贝叶斯学派. 频率学派和贝叶斯学派的参数估计

maximum likelihood estimation (MLE)

对于统计模型来说,比较常见的方法有极大似然估计.假定参数是一个变量,并认为已经发生的就是概率最大的事情.即似然函数最大, 通过求似然函数极值,求解参数.

似然函数的理解

然而 MLE 只能找到全局最优解,有的情况下,更是没法显示求得似然函数.

maximum a posteriori estimation (MAP)

从贝叶斯学派的观点,MLE 只是 MAP 的特殊情况,即先验概率为均匀分布的情况,贝叶斯学派认为先验概率也很重要.这也是生成模型里用到的思想.

wiki讲的也很清楚