这些数据集都不能使用线性分类/回归建模。
在“输入数据转换”的情况下,如果只有数据集是一致的(没有两个完全相同的点与两个不同的标签)
的
总是存在转换,之后数据可以线性分离
</强>
。特别是可以用以下方法构建它:
phi(x) = 1 iff label of x is “1”
</code>
换句话说,您将所有正样本映射到“1”,将负数映射到“0”,因此您的数据现在可以线性分离。或者简单地将你的N个点映射到R ^ N空间中的N个单位向量,使得我的点被映射到[0 0 0 … 1 … 0 0 0] ^ T,其中出现“1”在我的地方。对于任何标记,这样的数据集可以线性地线性分离。