有一个名为“矢量空间数学如何帮助机器发现讽刺”的出版物适合您的问题(链接波纹管)。
我读了这篇文章,他们使用了一种超级方法,也就是说,他们从讽刺的正面例子中提取了一些特征。此外,本文建议使用Word2vec来提高模型的性能。
要构建一个讽刺分类器,您需要一个训练集。在本文中,他们使用书籍中的引文,用户在goodreads.com上将其标记为#sarcastic。您可以使用此网址抓取引号: https://www.goodreads.com/quotes/tag/sarcastic
您可以使用TF-IDF开始构建一个简单的模型,以从训练集中提取特征,并在使用SVM(支持向量机)创建模型后(或遵循以下文章中描述的方法)。
http://orange.hosting.lsoft.com/trk/click?ref=znwrbbrs9_6-117fex3101cbx0109662&
我希望它可以有所帮助