我认为如果你保持一个完整的统计方法,很难改进你的系统。从统计NLP的角度来看,你真的做了正确的事情。现在,您可以微调一些参数。要做到这一点,你必须通过告诉系统哪个答案是正确的来建立一个训练语料库......然后看看参数必须采取哪个值来给你这个答案。
话虽这么说,我认为微调参数不会使你的准确度提高20%~30%。
如果你想更进一步,你需要一种更加语义的方法,并象征性地代表知识。检查一下 http://www.jfsowa.com/
这是一个被充分研究的问题,称为问答(QA)。我已经提供了有关QA的摘要 另一个答案 。特别是,你所有的例子都属于“定义问题”的范畴,根据 TREC 。我建议仔细阅读一些关于“TREC定义问题”查询的文章 谷歌 要么 谷歌学术 为了想法。