我认为您的想法是有效的,但机器学习模型并非始终100%准确。这就是为什么为模型定义“准确度”的原因。
如果您想创建高性能预测模型,那么请选择深度学习模型,因为随着训练数据集大小的增加,其性能会随着时间的推移而提高。
我认为这是分类问题的一个很好的用例。由于数据集中只有少数列(要素),我想从简单的Boosted决策树分类算法开始。