注册
登录
测试训练
特征向量:训练与测试集的权重计算
返回
特征向量:训练与测试集的权重计算
作者:
故人
发布时间:
2024-12-27 11:06:03 (1月前)
转自:
我正在使用支持向量机进行文本分类,但基本上我对特征向量的计算感到困惑
测试 跨度> 组。 对于
训练 跨度> 特征向量,我为每个took采用TF-IDF向量
训练 跨度> 数据,并使用TF-IDF值构建特征矩阵[docs x terms]。 但是如何计算
测试 跨度> 设置的特征向量?我应该只使用TF-IDF值
训练 跨度>
收藏
举报
2 条回复
0#
回复此人
咿呀哟
|
2019-08-31 10-32
您应该使用训练集计算每个术语的IDF(逆文档频率)。然后,您应该为测试集中的文档使用相同的IDF。另一方面,TF取决于您尝试分类的具体文档,因此测试和训练集中的不同文档会有所不同。
编辑
登录
后才能参与评论