您可以使用sklearn提供的train_test_split方法。请参阅此处的文档
http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html
我正在尝试建立一个分类模型。我在本地文件夹中有1000个文本文档。我想把它们分成两部分
训练
</跨度>
设置和
测试
</跨度>
设定分裂比为70:30(70->
训练
</跨度>
和30 - &gt;
测试
</跨度>
倒是这个问题。虽然我得到了近乎完美的答案,但我还想简要提问。
我想以编程方式分割方法
训练
</跨度>
设置和
测试
</跨度>
组。首先阅读 中的文件