你有20个月的答案作为功能。设是1,不是0.所以有20个二进制特征。
您还有目标变量(赢/输)数据。让win为1,丢失为0.您可以立即使用SVM / NN。根据我的经验,SVM和逻辑回归给出了类似的精度。
但是,如果您希望解释每个功能在决策中的贡献,您应该使用朴素贝叶斯或决策树
重要的是要知道谁在说是和否,所以如果有10位专家用yes / no / na回答这20个问题,你就有10x20x3状态或二进制功能,每个专家都有60个功能。
此外,您可以使用项目本身的功能,例如项目来自石油行业或采矿或制造等。一些专家可能在一个行业中的预测优于其他行业。
对于分类,您可以尝试sklearn中的随机森林。
请注意,您可以通过将样本标记为公司从追求( - 或+)或忽略(0)获得的利润或损失金额,而不是分类(标记项目是否被追踪或忽略) ) 该项目。
希望这可以帮助。