神经网络分类器,PyTorch实现
该项目不再更新,请转到 clfzoo
分本分类的方法有很多种,而且传统的机器学习方法就能有很好的效果,
神经网络的话在小数据量下是体现不出效果的,而且神经网络训练周期长。
分享这个项目就当作加深对卷积神经网络CNN以及递归神经网络RNN的理解吧。
那么本项目主要有哪些亮点呢?
1. 支持batch_size,短文本一般长度不一,所以用PyTorch的话一般得要自己封装好输入向量
看PyTorch文档时是不是在LSTM,GRU...这些地方会看到pack_padded_sequence(), pad_packed_sequence()呢?
在这里就可以用到了
2. 支持word2vec训练后的词向量表代替Embedding的权值。是不是有很多地方都说使用预训练的词向量效果会好?那究竟怎么用呢?
在这里就可以用到了
以上两点我都做了封装,看代码应该可以能理解,使用方法