这些模型是受监督的机器学习技术,这意味着训练模型不仅需要训练数据(即测量矢量),还需要与每个样本相关的标记(或连续值)。例如,如果您尝试检测包含猫的图像,则会有一组训练集,例如500张不包含猫的图像和500张包含猫的图像。您计算所有1000个图像的描述符,并为每个类别分配一个数字(按照惯例,-1表示“非猫”,1表示“猫”)。然后,响应将是1000x1整数的矩阵,前500个值为-1,而剩余值为1。
在您的示例中,atof用于将目录名称转换为表示类别的唯一编号,因为训练示例可能按文件夹(文件夹猫,狗,自行车等)排序。