2.4. 感知机如何处理非线性可分集¶

预期收益

时间成本

2.4.1. PLA 实际使用时可能存在问题¶

PLA 收敛的前提假设是, 训练数据集线性可分, 实际使用中, 无法确定训练数据集是线性可分

\[\mathop{\arg\min}_{w}{\sum_{i=1}^N{\|y_n \neq sign(w \cdot x_n)\|}}\]

不幸的是, 上述问题为NP-hard, 这一类问题尚无法求其最优解

通常采用近似算法求其解, 其基本思想, 在当前状态下, 获取最优迭代策略

核心思想, 每迭代一步, 都能使得分错点的个数在减少

我们在PLA过程中, 每次找到误分点, 然后进行迭代. PLA可能有以下问题

pocket algorithm 在PLA的基础做了调整

权重迭代更新公式和PLA一致, 但增加每次进行迭代时有效性判断
- 判断新的权重是否能够有效减少分类错误点的个数, 如果不能减少分类点的个数, 则放弃此次迭代
- 重新选取误分类点, 计算新的权重, 依次类推
增加选取错误分类点的随机性, 保证所有分类点都有相同的机会得到修正
终止条件, 达到一定迭代次数终止