基于最大间隔马尔可夫网络的句法分析

最大间隔是SVM(支持向量机)中的重要理论,而马尔可夫网络是概率图模型中一种具备一定结构处理关系能力的算法。最大间隔马尔可夫网络(Max-Margin Markov Networks)就是这两者的结合,能够解决复杂的结构化预测问题,尤为适合用于句法分析任务。这是一种判别式的句法分析方法,通过丰富特征来消解分析过程中产生的歧义。其判别函数采用如下形式:

fx(x)=argmaxyG(x)w,Φ(x,y)f_x(x)=\mathop{\arg\max}\limits_{y\in G(x)}\langle w,\Phi(x,y)\rangle

其中, Φ(x,y)\Phi(x,y) 表示与 xx 相对应的句法树 yy 的特征向量, ww 表示特征权重。

类似SVM算法,最大间隔马尔可夫网络要实现多元分类,可以采用多个独立而且可以并行计算的二元分类器来代替。这样,每个二元分类器识别一个短语标记,通过组合这些分类器就能完成句法分析任务,同时也能通过并行方式,大大提升训练速度。

Last updated