在监督学习中,例如SVM,数据集应该如下组成:
<i-th feature vector><i-th label>
哪里 i 从1到模式的数量(也是 例子 要么 意见 )在训练集中,这表示训练集中的单个记录可用于训练SVM分类器。
i
所以你基本上有一个由这样的元组组成的集合,如果你只有2个标签(二进制分类问题),你可以很容易地使用SVM。实际上,SVM模型将通过训练集和训练标签进行训练,一旦训练阶段结束,您可以使用另一组(称为验证集或测试集),其结构与训练集相同,测试SVM的准确性。 换句话说,SVM工作流程的结构应如下所示:
知道训练集记录应该是很重要的 正确的,先验标记 :如果训练标签不正确,SVM将永远无法正确预测以前看不见的模式的输出。您不必根据要提取的ROI标记数据,必须事先正确标记数据:SVM将具有整个A类图片集和B类图片集,并将学习决策边界分离A型图片和B型图片。您不必欺骗标签:如果这样做,您就不会进行分类和/或机器学习和/或模式识别。你基本上是在欺骗结果。