这可能不是一个令人满意的答案...... 首先,您必须选择一组要用于训练分类器的属性。然后,您必须选择要学习的分类器模型。并且您最终必须提供训练集,测试集和验证集,它们都是原始集的子集。许多技术允许选择模型及其参数,这些模型及其参数在已经学习和测试所有这些结果的情况下给出预测的最佳(或最差)结果。
我的建议是使用scikit-learn( http://scikit-learn.org/stable/ )并花时间访问其教程: http://scikit-learn.org/stable/tutorial/ 。你会发现有很多有用的信息应该有所帮助。在学习预测模型时,如何给出培训项目及其预期结果。