非线性可分问题

能用一个超曲面将训练数据集的正负例正确分开,则称这个问题为非线性可分问题。
方法:通过非线性变换将非线性问题转化为线性问题。


核函数的引入
定义一个从低维特征空间到高维特征空间的映射ϕ,将所有特征映射到一个更高的维度,让数据线性可分。
目标函数中高维特征仅以内积形式出现
核函数的定义:
假设ϕ是一个从低维的输入空间χ(欧式空间的子集或者离散集合)到高维的希尔伯特空间的H映射。如果存在函数K(x,z),对于任意x,z∈χ,都有:
则称函数K(x,z)为核函数。
核函数的意义
- 通常H是非常高维的,甚至是无穷维的,映射ϕ的计算量非常大或无法计算;
- 在学习和预测中,直接定义K(x,z),可以不用显式地定义ϕ.
- 核函数虽然也是将特征进行从低维到高维的转换,但它是在低维上进行计算,将实质上的分类效果(利用了内积)表现在了高维上,这样避免了直接在高维空间中的复杂计算。
正定核
一般所说的核函数都是正定核函数。
正定核函数的充分必要条件
一个函数要想成为正定核函数,必须满足他里面任何点的集合形成的Gram矩阵是半正定的。
常用核函数
- 线性核函数(即线性SVM)
- 多项式核函数
- 高斯核函数
- sigmoid核函数