您不需要将文档转换为文本,您可以直接使用图像。
要进行图像分类,您可以使用Keras库构建基本的CNN。
https://towardsdatascience.com/building-a-convolutional-neural-network-cnn-in-keras-329fbbadc5f5
这个基本的CNN足以训练图像分类器。但是你想要获得最先进的精确度,我建议得到一个预训练的resnet50并训练它来构建一个图像分类器。除了准确性之外,使用预训练网络还有另一个主要优势,您需要更少的数据来训练强大的图像分类器。
https://engmrk.com/kerasapplication-pre-trained-model/?utm_campaign=News&utm_medium=Community&utm_source=DataCamp.com
您需要更改的唯一内容是输出类的数量从1000到您想要的类数。