我建议从以下文章开始 诺维格拼写正确 。它解释了拼写校正器背后提供的python代码的基本思想。
我想在这里做的是在不到一页的代码中开发一个玩具拼写校正器,它以每秒至少10个字的处理速度达到80或90%的准确度。
根据这篇文章:“工业强度法术纠正器的全部细节非常复杂。”你可以从它的参考文献开始。我认为无论您实施什么,都必须具有比此实施更好的准确性/性能。
如果您只需要检查拼写,则可以从一些免费提供的字典中创建所有单词的哈希集,然后检查键入的单词是否在字典中。你的任务还有其他要求吗?
Peter Norvig和Stuart Rusell的着作“人工智能 - 现代方法”将是一个很好的起点。